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内 容 简 介 


全 书 主要 论述 了 数据 库 相 关 基 本 概念 基本 理论 和 基本 技术 ,共计 9 章 , 内 容 包括 数据 库 系统 的 产生 
与 发 展 \ 数 据 库 系统 特点 、 数 据 库 系统 的 数据 模型 .数据 库 系 统 体 系 结构 、 关 系数 据 库 方法 、 关 系数 据 库 标 
准 语言 SQL、 关 系 规范 化 理论 ,数据库 设计 数据库 保 护 .数据库 设 计 实例 和 数据 库 技术 新 发 展 等 。 

本 书 既 介绍 了 经 典 的 数据 库 理论 及 设计 方法 ,又 展示 了 目前 广泛 应 用 的 开源 数据 库 管理 系统 MySQL 


的 实际 操作 步骤 ， 


同时 还 给 出 了 一 个 侧重 数据 库 设 计 过 程 的 应 用 系统 开发 实例 ,打通 了 从 理论 到 具体 


DBMS 应 用 再 到 实例 开发 三 个 重要 环节 。 为 初学 者 打 牢 理 论 基础 的 同时 ,又 梳理 了 数据 库 应 用 程序 开发 
的 重要 环节 ,做 到 学 以 致 用 。 

本 书 可 以 作为 高 等 院 校 计算 机 专业 数据 库 原理 与 应 用 课程 的 教学 用 书 、 计 算 机 相关 专业 的 教学 用 书 ， 
也 可 以 作为 从 事 计算 机 、 管 理科 学 工作 的 读者 ,以 及 科技 人 员 和 对 数据 库 技术 感 兴趣 的 初学 者 等 的 学 习 用 


书 或 参考 书 。 
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随 着 我 国 改革 开放 的 进一步 深化 ,高 等 教育 也 得 到 了 快速 发 展 ,各 地 高 校 紧 密 结合 地 方 
经 济 建设 发 展 需要 ,科学 运用 市 场 调节 机 制 ,加 大 了 使 用 信息 科学 等 现代 科学 技术 提升 \ 改 
造 传统 学 科 专业 的 投入 力度 ,通过 教育 改革 合理 调整 和 配置 了 教育 资源 ,优化 了 传统 学 科 专 
业 , 积 极为 地 方 经 济 建设 输送 人 才 ,为 我 国 经 济 社 会 的 快速 、 健 康 和 可 持续 发 展 以 及 高 等 教 
育 自身 的 改革 发 展 做 出 了 巨大 贡献 。 但 是 ,高 等 教育 质量 还 需要 进一步 提高 以 适应 经 济 社 
会 发 展 的 需要 ,不 少 高 校 的 专业 设置 和 结构 不 尽 合理 ,教师 队伍 整体 素质 吸 待 提高 ,人 才 培 
养 模 式 ,教学 内 容 和 方法 需要 进一步 转变 ,学 生 的 实践 能 力 和 创新 精神 亚 待 加 强 。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ,教育 部 下 发 了 《关于 实施 高 等 
学 校本 科教 学 质量 与 教学 改革 工程 的 意见 》, 计 划 实 施 “ 高 等 学 校本 科教 学 质量 与 教学 改革 
工程 (简称 “质量 工程 ')”, 通 过 专业 结构 调整 ,课程 教材 建设 、 实 践 教学 改革 、 教 学 团队 建设 
等 多 项 内 容 , 进 一 步 深 化 高 等 学 校 教学 改革 ,提高 人 才 培 养 的 能 力 和 水 平 ,更 好 地 满足 经 济 
社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 落实 教育 部 “质量 工程 "的 过 程 中 ,各 地 高 校 发 挥 
师资 力量 强 ,办 学 经 验 丰 富 ,教学 资源 充裕 等 优势 ,对 其 特色 专业 及 特色 课程 ( 群 ) 加 以 规划 、 
整理 和 总 结 ,更 新 教学 内 容 \ 改 革 课 程 体系 ,建设 了 一 大 批 内 容 新 .体系 新 方法 新 .手段 新 的 
特色 课程 。 在 此 基础 上 ,经 教育 部 相关 教学 指导 委员 会 专家 的 指导 和 建议 ,清华 大 学 出 版 社 
在 多 个 领域 精 选 各 高 校 的 特色 课程 ,分 别 规划 出 版 系列 教材 ,以 配合 “质量 工程 ”的 实施 , 满 
足 各 高 校 教学 质量 和 教学 改革 的 需要 。 

本 系列 教材 立足 于 计算 机 专业 课程 领域 ,以 专业 基础 课 为 主 、 专 业 课 为 辅 ,横向 满足 高 
校 多 层次 教学 的 需要 。 在 规划 过 程 中 体现 了 如 下 一 些 基 本 原则 和 特点 。 

(1) 反映 计算 机 学 科 的 最 新 发 展 ,总 结 近年 来 计算 机 专业 教学 的 最 新 成 果 。 内 容 先 进 ， 
充分 吸收 国外 先进 成 果 和 理念 。 

(2) 反映 教学 需要 ,促进 教学 发 展 。 教 材 要 适应 多 样 化 的 教学 需要 ,正确 把 握 教学 内 容 
和 课程 体系 的 改革 方向 ,融合 先进 的 教学 思想 、 方 法 和 手段 ,体现 科学 性 、 先 进 性 和 系统 性 ， 
强调 对 学 生 实践 能 力 的 培养 ,为 学 生 知识 、 能 力 、 素 质 协调 发 展 创造 条 件 。 

(3) 实施 精品 战略 ,突出 重点 ,保证 质量 。 规 划 教 材 把 重点 放 在 公共 基础 课 和 专业 基础 
课 的 教材 建设 上 ; 特别 注意 选择 并 安排 一 部 分 原来 基础 比较 好 的 优秀 教材 或 讲义 修订 再 
版 ,逐步 形成 精品 教材 ; 提倡 并 鼓励 编写 体现 教学 质量 和 教学 改革 成 果 的 教材 。 

(4) 主张 一 纲 多 本 ,合理 配套 。 专 业 基础 课 和 专业 课 教 材 配 套 , 同 一 门 课程 有 针对 不 同 
层次 、 面 向 不 同 应 用 的 多 本 具有 各 自 内 容 特点 的 教材 。 处 理 好 教材 统一 性 与 多 样 化 ,基本 教 
材 与 辅助 教材 教学 参考 书 ,文字 教材 与 软件 教材 的 关系 ,实现 教材 系列 资源 配套 。 

(5) 依靠 专家 ,择优 选用 。 在 制定 教材 规划 时 要 依靠 各 课程 专家 在 调查 研究 本 课程 教 
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材 建设 现状 的 基础 上 提出 规划 选 题 。 在 落实 主编 人 选 时 ,要 引入 竞争 机 制 , 通 过 申报 、 评 审 
确定 主题 。 书 稿 完成 后 要 认真 实行 审 稿 程序 ,确保 出 书 质 量 。 

繁荣 教材 出 版 事业 ,提高 教材 质量 的 关键 是 教师 。 建 立 一 支 高 水 平 教材 编写 梯队 才能 
保证 教材 的 编写 质量 和 建设 力度 ,希望 有 志 于 教材 建设 的 教师 能 够 加 入 到 我 们 的 编写 队伍 
中 来 。 


21 世纪 高 等 学 校 计 算 机 专业 实用 规划 教材 
联系 人 : 魏 江 江 weijj@tup. tsinghua. edu. cn 


数据 库 技术 是 目前 计算 机 科学 技术 领域 发 展 最 快 、 应 用 最 广泛 的 技术 之 一 ,体现 了 数据 
管理 及 信息 处 理 的 最 高 发 展 水 平 。 在 大 数据 技术 莲 勃 发 展 的 今天 ,更 需要 对 经 典 数 据 库 理 
论 的 理解 和 学 习 , 为 日 新 月 异 的 数据 管理 技术 奠定 扎实 的 理论 基础 。 

数据 库 技术 从 诞生 开始 到 现在 一 直 倍 受 人 们 关注 ,目前 无 论 在 计算 机 系统 中 的 位 置 ,还 
是 在 计算 机 应 用 中 的 地 位 ,以 及 在 计算 机 专业 课程 中 的 地 位 都 是 非常 重要 的 ,已 经 成 为 计算 
机 信息 系统 和 计算 机 应 用 系统 的 重要 技术 基础 和 支柱 。 因 此 ,数据 库 技术 是 一 个 十 分 活跃 
的 研究 领域 ,也 是 一 个 日 新 月 异 的 研究 领域 。 

本 书 是 在 第 一 版 教材 (数据 库 原理 与 应 用 ) 的 基础 上 进行 编写 的 ,教材 自 2010 年 出 版 至 
2018 年 1 月 共 进行 了 5 次 印刷 。 为 了 满足 教学 需要 和 广大 读者 的 需求 ,作者 重新 改编 了 本 
教材 。 

本 书 以 关系 数据 库 为 核心 ,重点 介绍 了 数据 库 相关 的 基本 概念 、 基 本 原理 和 实用 的 数据 
库 设 计 技 术 , 着 力 打 通 数 据 库 技术 从 理论 到 DBMS 应 用 再 到 实例 开发 的 三 个 重要 环节 , 帮 
助 初学 者 建立 扎实 的 理论 基础 ,同时 建立 清晰 的 知识 脉络 ,为 后 续 的 深入 学 习 开 辟 良 好 的 开 
端 。 希 望 本 书 能 够 使 读者 对 数据 库 系 统 有 一 个 全 面 、 深 入 .系统 的 了 解 ,为 进一步 从 事 数据 
库 系 统 的 研究 .开发 和 应 用 黄 定 坚实 的 基础 。 

本 书 主要 特点 如 下 。 

(1) 针对 高 等 学 校 教学 大 纲 对 本 课程 的 要 求 ,重点 讲述 数据 库 基 本 概念 .基本 原理 和 基 
本 技术 ,同时 充分 考虑 教学 的 需要 ,在 内 容 选 取 、 难 易 程 度 等 因素 上 都 有 所 考虑 。 根 据 教学 
实际 情况 ,本 书 的 内 容 适 用 于 48 一 64 学 时 教学 。 

(2) 本 书 选择 轻 量 级 开源 数据 库 管 理 系统 MySQL ,详细 地 讲述 了 安装 过 程 和 具体 的 
SQL 语句 ,为 读者 提供 一 个 练习 SQL 语句 的 DBMS 环境 。 

(3) 为 了 帮助 读者 能 够 更 加 容易 地 将 理论 知识 和 DBMS 中 练习 的 SQL 语句 ,应 用 到 程 
序 的 开发 过 程 中 ,本 书 给 出 开发 实例 ,重点 介绍 数据 库 设计 的 各 个 步骤 及 相应 内 容 , 以 及 与 
应 用 程序 建立 连接 的 方法 ,真正 实现 “从 原理 到 应 用 ”。 

(4) 力求 反映 当前 数据 库 领 域 的 新 水 平 、 新 技术 。 在 多 种 类 型 数据 库 技 术 基 础 上 ,增加 
了 大 数据 存储 及 管理 NoSQL 技术 ,帮助 读者 初步 了 解 传统 数据 库 到 大 数据 技术 的 演变 过 
程 ,同时 体会 大 数据 存储 及 管理 技术 的 特殊 之 处 。 

本 书 由 孟 凡 荣 主 编 ,其 中 , 孟 凡 荣 编写 第 1 章 和 第 9 章 中 的 部 分 内 容 , 并 负责 全 书 的 统 
稿 , 间 秋 艳 编写 第 5 章 和 第 9 章 , 并 协助 全 书 的 统 稿 . 囊 冠 编写 第 7 章 和 第 8 章 , 葛 欣 编写 第 
3 章 , 雷 小 锋 编 写 第 6 章 , 谢 红 侠 编 写 第 4 章 , 徐 慧 编写 第 2 章 , 王 志 晓 编写 第 9 章 的 部 分 
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内 容 。 
本 书 标 x* 章节 为 非 重点 章节 , 感 兴趣 的 读者 可 自主 学 习 。 
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第 1 章 绪 论 


数据 库 技术 的 研究 是 从 20 世纪 60 年 代 开 始 的 ,在 这 五 十 多 年 中 有 一 大 批 研究 者 做 了 
大 量 的 工作 ,并 且 取 得 了 重大 成 就 ,其 中 最 值得 骄傲 的 是 有 4 位 图 灵 奖 获得 者 ,他 们 是 : 网 
状 数据 库 之 父 查尔斯 。 威 廉 。 巴 赫 曼 (Charles. W. Bachman) ,关系 数据 库 之 父 埃 德 加 。 科 
德 (Edgar F. Codd) ,数据 库 技术 和 事务 处 理 专 家 詹姆斯 . 格雷 (Jim Gray) 和 对 现代 数据 库 
系统 底层 的 概念 与 实践 做 出 基础 性 贡献 的 迈克 尔 。 斯 通 布雷 克 (Michael Stonebraker) 。 

数据 库 技术 不 仅 得 到 了 数据 库 研究 者 的 关注 ,而 且 还 得 到 了 众多 使 用 者 的 关注 。 目 前 
数据 库 技术 已 经 是 计算 机 科学 的 重要 分 支 ,也 是 计算 机 科学 技术 中 发 展 最 快 和 应 用 最 广泛 
的 重要 分 支 之 一 。 数 据 库 技术 已 经 成 为 计算 机 信息 系统 和 计算 机 应 用 系统 的 重要 技术 基础 
和 支柱 ,带动 了 一 个 巨大 的 软件 产业 ,是 理论 成 果 转 化 为 产品 的 成 功 范例 。 

本 章 主要 闸 述 数据 库 相 关 的 基本 概念 ,介绍 数据 库 技 术 产 生 与 发 展 的 背景 ,数据 库 系 统 
的 特点 ,数据 模型 的 组 成 要 素 、 概 念 模型 及 数据 库 系 统 体系 结构 。 

通过 本 章 的 学 习 , 要 求 读者 能 够 掌握 数据 库 、 数 据 库 管理 系统 、 数 据 库 系 统 和 数据 库 应 
用 系统 的 基本 概念 ; 了 解数 据 管理 技术 的 产生 和 发 展 过 程 ; 了 解 层 次 数据 模型 及 网 状 数据 
模型 的 基本 概念 ; 掌握 关系 数据 模型 的 相关 概念 ; 掌握 数据 库 系 统 的 组 成 ,数据 库 系统 三 
级 模式 和 两 层 映像 的 体系 结构 ,数据 库 系 统 的 特点 ; 了 解 DBA 的 职责 ; 特别 应 该 掌握 概念 
模型 的 基本 概念 及 其 主要 建 模 方法 一 一 实体 -联系 方法 。 

学 习 本 章 的 重点 在 于 基本 概念 和 基本 知识 的 把 握 ,从 而 为 后 续 的 学 习 打下 良好 和 扎实 
的 基础 。 


1.1 数据 库 、 数 据 库 管 理 系 统 、 数 据 库 
系统 和 数据 库 应 用 系统 

目前 数据 库 的 应 用 非常 广泛 ,几乎 各 行 各 业 都 在 直接 或 间接 地 与 数据 库 打交道 ,例如 网 
上 购物 .银行 业务 铁路 购 票 和 酒店 住宿 等 。 在 实际 应 用 中 ,数据 库 、 数 据 库 管理 系统 、 数 据 
库 系 统 和 数据 库 应 用 系统 经 常 被 统称 为 数据 库 ,而 实质 上 这 4 个 概念 是 不 一 样 的 ,它们 具有 
不 同 的 定义 和 含义 。 下 面 首先 介绍 这 4 个 概念 的 定义 与 含义 ,以 便 在 后 续 的 学 习 中 能 够 根 
据 上 下 文 的 关系 正确 使 用 相关 的 术语 。 
1.1.1 数据 库 


目前 关于 数据 库 (Database, DB) 的 概念 ,还 没有 统一 而 明确 的 定义 。 原 因 主 要 在 于 数 
据 库 技术 是 一 门 新 兴学 科 , 它 的 概念 原理 和 方法 仍 在 不 断 发 展 变化 中 , 它 所 涉及 的 领域 也 
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非常 广泛 ,所 以 国内 外 不 同人 士 从 不 同 的 角度 给 出 了 很 多 不 同 的 描述 。 下 面 列举 了 部 分 专 
家 学 者 对 数据 库 给 出 的 定义 。 

(1) 长 期 存储 在 计算 机 内 的 有 组 织 的 和 可 共享 的 数据 集合 。 

(2) 相互 关联 的 数据 集合 。 

(3) 可 供用 户 分 享 的 数据 集合 体 。 

(4) 一 群 物理 数据 单元 的 集合 体 ,这 些 数据 单元 之 间 存 在 某 种 关系 。 

(5) 能 为 计算 机 所 存 取 的 任何 数据 的 集合 体 。 

(6) 由 一 个 模式 控制 的 记录 和 集合 区 域 的 集合 体 。 

(7) 存放 数据 的 仓库 。 

(8) 按 一 定 方式 存储 在 一 起 的 数据 集合 体 。 

(9) 有 组 织 的 数据 集合 ,其 结构 能 反映 数据 间 的 自然 关系 ,能 满足 多 种 应 用 。 

(10) 彼此 之 间 存 在 逻辑 关系 的 一 些 数据 的 存储 体 。 

(11) 数据 库 是 一 个 记录 保存 系统 。 

(12) 数据 库 是 长 期 存储 在 计算 机 系统 内 的 一 个 通用 化 的 、 综 合 性 的 有 结构 的 、 可 共享 
的 数据 集合 ; 具有 较 小 的 数据 元 余 度 和 较 高 的 数据 独立 性 、 安 全 性 和 完整 性 ; 数据 库 的 创 
建 . 运 行 和 维护 是 在 数据 库 管理 系统 控制 下 实现 的 ,并 可 为 各 种 用 户 共享 。 

(13) 使 用 数据 库 管 理 系 统 建立 起 来 的 并 由 数据 库 管 理 系 统 所 能 存 取 和 维护 的 数据 及 
数据 间 逻 辑 关 系 的 集合 体 。 

4) 数据 库 是 存储 在 一 起 的 相关 数据 的 集合 ,这 些 数 据 没 有 不 必要 的 元 余 , 能 为 多 种 
应 用 服务 ; 数据 的 存储 独立 于 程序 ; 对 数据 库 的 插入 修改 和 检索 均 能 按 一 种 公用 的 和 可 
控 的 方法 进行 ; 若 在 一 个 系统 中 存在 着 结构 上 完全 分 离 的 多 个 数据 库 , 则 称 该 系统 为 一 个 
数据 库 集合 。 

(15) 数据 库 是 存储 在 磁 鼓 、 磁 盘 或 其 他 存储 介质 上 的 数据 集合 ; 有 若干 个 应 用 程序 以 
数据 库 为 背景 进行 检索 ,修改 、 插 入 或 删除 等 操作 ,还 可 能 有 一 些 联 机 远程 终端 用 户 访问 数 
据 库 ; 数据 库 是 集成 的 ,包含 许多 用 户 的 数据 ,每 个 用 户 只 享用 其 中 一 部 分 数据 ,不 同 用 户 
所 使 用 的 数据 可 以 重 琶 ,并 且 同 一 片 数据 可 以 为 多 用 户 共 享 。 

(16) 数据 库 是 存储 在 一 起 的 相关 数据 的 集合 ,这 些 数据 是 结构 化 的 ,无 有 害 的 或 不 必 
要 的 宛 余 ,并 为 多 种 应 用 服务 ; 数据 的 存储 独立 于 使 用 它 的 程序 ; 对 数据 库 插入 新 数据 、 修 
改 和 检索 原 有 数据 均 能 按 一 种 公用 的 和 可 控制 的 方式 进行 。 当 某 个 系统 中 存在 结构 上 完全 
分 开 的 若干 个 数据 库 时 , 则 该 系统 包含 一 个 “数据 库 集合 ”。 

(17) 数据 库 是 依照 某 种 数据 模型 组 织 起 来 并 存放 在 二 级 存储 器 中 的 数据 集合 。 这 种 
数据 集合 具有 如 下 特点 : 尽 可 能 不 重复 ,以 最 优 方式 为 某 个 特定 组 织 的 多 种 应 用 服务 ,其 数 
据 结构 独立 于 使 用 它 的 应 用 程序 ,对 数据 的 增加 、 删 除 、 修 改 和 检索 由 统一 软件 进行 管理 和 
控制 。 

(18) 数据 库 是 长 期 存储 在 计算 机 内 、 有 组 织 的 、 可 共享 的 大 量 数据 的 集合 。 数 据 库 中 
的 数据 按 一 定 的 数据 模型 组 织 .描述 和 存储 ,具有 和 较 小 的 元 余 度 、 较 高 的 数据 独立 性 和 易 扩 
展 性 ,并 可 为 各 种 用 户 共享 。 

上 述 定义 尽管 有 所 不 同 ,但 都 认为 数据 库 是 数据 的 集合 体 ,而 且 这 个 集合 体 中 的 数据 必 
须 能 够 被 计算 机 管理 并 为 多 个 用 户 共享 。 


一 


在 这 里 给 出 数据 库 的 另外 一 种 定义 。 
数据 库 是 指 在 计算 机 的 存储 设备 上 合理 存放 相关 联 、 有 结构 的 数据 集合 。 
数据 库 定 义 的 示意 图 如 图 1-1 所 示 。 


结构 数据 (合理 ) 结构 数据 (合理 ) 
| PN 。 关联 


结构 数据 (合理 ) 结构 数据 (合理 ) 


1-1 数据 库 定 义 的 示意 图 


这 个 定义 具有 如 下 含义 。 

(1) 数据 库 首 先是 指 在 计算 机 的 存储 设备 上 存放 的 、 属 于 计算 机 领域 的 一 个 术语 。 

(2) 数据 库 是 一 个 数据 集合 。 

(3) 这 个 数据 集合 是 有 结构 的 ,这 一 点 也 是 和 文件 系统 相 比 最 大 的 特点 之 一 。 

(4) 这 个 数据 集合 是 相关 联 的 数据 集合 ,并 且 只 有 相关 联 的 数据 才 可 以 存放 在 一 起 , 否 
则 没有 意义 和 研究 价值 。 

(5) 这 个 数据 集合 是 合理 存放 的 。 那 么 到 底 该 如 何 合理 存放 ? 这 也 是 数据 库 技 术 研 究 
的 关键 问题 之 一 ,数据 库 规范 化 理论 和 数据 库 设 计 方法 专门 研究 合理 存放 问题 。 

这 个 定义 相对 更 适合 理解 和 记忆 ,并 且 含义 丰富 。 


1.1.2 数据 库 管理 系统 


数据 库 管理 系统 (Database Management System,DBMS) 是 一 个 操纵 和 管理 数据 库 的 
大 型 软件 , 它 由 一 组 计算 机 程序 构成 。 它 是 位 于 用 户 与 操作 系统 之 间 的 一 层 数据 管理 软件 。 
它 能 够 对 数据 库 进 行 有 效 的 管理 ,包括 建立 和 维护 数据 库 ,接收 和 完成 用 户 访问 数据 库 的 各 
种 请 求 。 数 据 库 管 理 系统 和 操作 系统 一 样 ,是 计算 机 的 系统 软件 或 者 叫 基础 软件 。 

数据 库 管 理 系统 包含 的 功能 很 多 ,不 同 DBMS 的 功能 也 有 差异 ,但 是 总 的 来 说 应 该 具 
备 数据 定义 功能 \ 数 据 存 取 功能 、 数 据 库 运行 管理 功能 、 数 据 库 建立 和 维护 功能 ,以 及 数据 库 
的 传输 功能 等 。 

目前 ,数据 库 市 场 上 有 很 多 数据 库 管 理 系统 产品 ,例如 ,Oracle、Sybase、DB2、MySQL、 
Access\、PostgreSQL MySQL 和 Microsoft SQL Server 等 。 

典型 的 DBMS 程序 模块 组 成 如 图 1-2 所 示 。 

由 图 1-2 可 以 看 出 ,DBMS 是 一 个 复杂 的 系统 , 它 可 以 完成 数据 库 的 存 取 , 但 同时 还 需 
要 考虑 安全 性 管理 、 完 整 性 管理 .并 发 控制 和 故障 恢复 等 。 
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模式 定义 公用 程序 
子 模 式 定义 公用 程序 
安全 性 定义 公用 程序 
完整 性 定义 公用 程序 


数据 库 定义 中 


DML 翻 译 程序 
DML 处 理 程序 
终端 查询 语言 解释 程序 
DB 控制 语言 解释 程序 


系统 初 启程 序 模块 
安全 作 控 制程 序 模块 
Pe 数据 库 运行 处 理 。 |+ 一 一 一 一 一 ”完整 性 控制 程序 模块 
功能 模块 TA 一 -一 
事务 管理 程序 模 坪 
并 发 控制 程序 模块 
运行 日 志 管理 程序 模块 


缓冲 区 管理 程序 模块 


a rr 
存 取 路 径 (索引 ) 管 理 程序 模 闫 
批量 数据 装 入 模块 
数据 库 建 立 、 维护 | | 数据 转 储 模块 
和 其 他 数据 库 重组 织 模块 
数据 转换 模块 


1-2 典型 的 DBMS 程序 模块 组 成 


1.1.3 数据 库 系 统 


关于 数据 库 系统 (Database System,.DBS) 的 定义 ,不 同 的 人 站 在 不 同 角度 也 给 出 了 不 
同 的 定义 。 例 如 ,从 强调 软件 作用 的 角度 有 人 给 出 ,数据 库 系 统 是 由 数据 库 及 其 管理 软件 组 
成 的 系统 ; 数据 库 系 统 是 为 适应 数据 处 理 的 需要 而 发 展 起 来 的 一 种 较为 理想 的 数据 处 理 系 
统 ,也 是 一 个 为 实际 可 运行 的 存储 、 维 护 和 应 用 系统 提供 数据 的 软件 系统 ,是 存储 介质 、 处 理 
对 象 和 管理 系统 的 集合 体 。 

然而 ,数据 库 系统 实际 上 不 仅 和 软件 有 关 , 而 且 还 因为 数据 库 就 是 存储 在 计算 机 存储 设 
备 上 的 ,所 以 必须 和 硬件 关联 。 因 此 ,数据 库 系统 是 用 于 实现 有 组 织 地 动态 地 存储 大 量 相 
关 的 结构 化 数据 ,便于 用 户 使 用 数据 库 的 计算 机 软件 和 硬件 资源 组 成 的 系统 。 换 言 之 ,数据 
库 系 统 是 指 在 计算 机 系统 中 引进 数据 库 和 数据 库 管理 系统 后 的 系统 。 

数据 库 系统 组 成 示意 图 如 图 1-3 所 示 。 

数据 库 系统 一 般 由 硬件 、 软 件数 据 库 和 用 户 4 部 分 组 成 。 
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1-3 数据库 系 统 组 成 示意 图 


1. 硬件 

硬件 是 数据 库 赖 以 存在 的 物理 设备 ,包括 输入 设备 ,输出 设备 ,运算 器 控制 器 和 存 
储 器 。 

2. 软件 

基本 的 系统 软件 是 操作 系统 ,其 他 任何 软件 都 必须 在 它 的 支持 下 工作 。 除 操作 系统 之 
外 ,还 必须 配 有 数据 库 管理 系统 ,没有 数据 库 管理 系统 也 就 不 能 称 其 为 数据 库 系统 。 同 时 ， 
为 了 开发 数据 库 应 用 系统 ,还 需要 有 各 种 高 级 语言 及 其 编译 系统 。 

3. 数据 库 

数据 库 是 一 个 企 事业 组 织 需 要 管理 的 全 部 相关 数据 的 集合 。 数 据 库 包 括 两 部 分 内 容 : 
一 类 是 所 有 应 用 需要 的 工作 数据 的 集合 ,存放 在 物理 数据 库 中 ,是 数据 库 的 主体 ; 另 一 类 是 
存放 在 数据 字典 (Data Dictionary,DD) 中 各 级 模式 的 描述 信息 ,主要 包括 所 有 数据 的 结构 
名 意义、 描述 定义 .存储 格式 、 完 整 性 约束 和 使 用 权限 等 信息 。 由 于 数据 字典 包含 数据 库 系 
统 中 的 大 量 描述 信息 ,而 不 是 用 户 数据 ,因此 也 称 之 为 “描述 信息 库 ”, 也 有 人 称 之 为 “描述 数 
据 库 的 数据 库 ”。 

4. 用 户 

用 户 包括 管理 .开发 人 员 和 终端 用 户 。 

1) 管理 和 开发 人 员 

具体 包括 数据 库 管 理 员 (Database Administrator,DBA) 、 系 统 分 析 员 和 应 用 程序 员 。 

(1) 数据 库 管理 员 

数据 库 管理 员 (DBA) 可 以 是 一 个 人 或 几 个 人 组 成 的 小 组 ,负责 整个 数据 库 系 统 的 建 
立 、 管 理 , 维 护 和 协调 工作 。 一 个 高 水 平 的 DBA 小 组 通常 由 操作 专家 、 系 统 分 析 和 设计 专 
家 、 应 用 专家 数据库 管 理 专家 、 查 询 语言 专家 和 数据 库 审计 专家 等 组 成 。 

DBA 的 主要 职责 有 以 下 4 个 方面 。 

@ 参与 数据 库 系 统 的 设计 与 建立 。 在 设计 和 建立 数据 库 时 ,DBA 参与 系统 分 析 和 系 
统 设计 ,决定 整个 数据 库 的 内 容 。 首 先 全 面 调查 用 户 的 需求 , 列 出 用 户 问 题 表 ,建立 数据 模 
式 并 写 出 数据 库 的 概念 模式 ; 和 用 户 一 起 建立 外 模式 ; 根据 应 用 要 求 决定 数据 库 的 存储 结 
构 和 存 取 策略 ,建立 数据 库 的 内 模式 。 最 后 将 数据 库 各 级 源 模式 经 过 编译 生成 目标 模式 并 
装 和 人 系统 ,然后 把 数据 装 入 数据 库 。 


击 一 剧 


数据 亩 原理 与 应 用 (MySQL 版 ) 


@ 对 系统 的 运行 实行 监控 。 在 数据 库 运行 期 间 , 为 了 保证 有 效 地 使 用 DBMS ,要 对 用 
户 的 存 取 权限 进行 监督 控制 ,并 收集 、 统 计数 据 库 运行 的 有 关 状 态 信息 ,记录 数据 库 数据 的 
变化 ,在 此 基础 上 响应 系统 的 某 些 变化 ,改善 系统 的 “时 空 ?性 能 ,从 而 提高 系统 的 执行 效率 。 

@ 定义 数据 的 安全 性 要 求 和 完整 性 约束 条 件 。DBA 负责 确定 用 户 对 数据 库 的 存 取 权 
限 、 数 据 的 保密 级 别 和 完整 性 约束 条 件 , 以 保证 数据 库 数据 的 安全 性 和 完整 性 。 

@ 负责 数据 库 性 能 的 改进 和 数据 库 的 重组 及 重 构 工作 。 

(2) 系统 分 析 员 

系统 分 析 员 负责 应 用 系统 的 需求 分 析 和 规范 说 明 , 需 与 用 户 和 DBA 结合 ,确定 系统 软 
件 、 硬 件 配置 ,数据 模型 设计 等 。 

(3) 应 用 程序 员 

应 用 程序 员 负责 应 用 系统 的 程序 设计 。 

2) 终端 用 户 

各 种 操作 人 员 ,可 以 不 懂 程序 ,但 必须 懂 业 务 、 会 操作 。 最 终 用 户 可 以 分 为 三 类 。 一 
类 是 偶然 用 户 , 这 类 用 户 不 经 常 访问 数据 库 , 偶 尔 提出 一 些 查询 需求 来 访问 数据 库 的 信 
息 , 他 们 一 般 是 部 门 的 中 高 级 管理 人 员 。 第 二 类 是 简单 用 户 , 这 类 用 户 经 常 和 数据 库 打 
交道 ,主要 完成 查询 和 更 新 数据 库 的 工作 ,如 商场 的 售货员 、 车 站 的 售票 员 、 宾 馆 总 台 服 
务 员 和 银行 职员 等 。 第 三 类 是 复杂 用 户 , 这 类 用 户 对 数据 库 管 理 系统 非常 熟悉 ,可 以 直 
接 通 过 数据 库 管理 系统 访问 数据 库 , 其 至 可 以 编制 自己 的 应 用 程序 ,如 工程 师 、 科 技工 作 

总 之 ,数据 库 系统 涉及 的 人 员 比 较 多 ,并 且 也 比较 复杂 ,因此 不 但 对 不 同人 员 有 不 同 的 
要 求 , 同 时 对 数据 库 管 理 系 统 提出 了 可 以 提供 多 种 界面 和 服务 机 制 的 要 求 。 


1.1.4 数据 库 应 用 系统 


数据 库 应 用 系统 (Database Application System,DBAS) 是 指数 据 库 系 统 及 其 应 用 程序 
的 组 成 , 即 在 数据 库 系统 环境 下 建立 起 来 为 某 种 应 用 服务 的 软 、 硬 件 的 集合 。 这 种 软件 也 经 
常 被 称 为 应 用 软件 。 

数据 库 ,数据库 系 统 、 数 据 库 管理 系统 和 数据 库 应 用 系统 之 间 的 关系 如 图 1-4 所 示 。 
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图 1-4 DB、DBMS、DBAS 与 DBS 之 间 的 关系 


1.2 数据 库 系 统 的 产生 与 发 展 


当 明确 了 数据 库 、 数 据 库 管理 系统 数据库 系统 和 数据 库 应 用 系统 概念 以 后 , 比 这 几 个 
概念 更 基础 和 相关 的 定义 也 需要 了 解 , 即 数据 、 信 息 以 及 与 数据 有 关 的 数据 管理 和 数据 
处 理 。 


1.2.1 数据 信息 .数据 管理 与 数据 处 理 


对 于 数据 和 信息 两 个 名 词 ,相信 读者 并 不 陌生 ,因为 在 日 常生 活 中 经 常 被 人 们 提 及 。 那 
么 究竟 什么 是 数据 ? 什么 是 信息 ? 关于 这 两 个 概念 ,目前 人 们 不 但 没有 给 出 准确 的 定义 ,而 
且 还 不 太 加 以 区 别 , 这 充分 说 明了 两 者 联系 密切 ,但 实质 上 两 者 还 是 有 区 别 的 。 

一 提 到 数据 ,大 多 数 人 想到 的 是 数字 。 其 实数 字 只 是 数据 中 的 一 种 ,数据 包含 的 种 
类 很 多 ,如 图 纸 .报表 声音 、 图 像 . 账 册 等 ,这 些 实际 上 就 是 人 们 反映 客观 世界 或 者 是 与 
客观 联系 的 介质 ,人 们 正 是 利用 这 些 介质 来 表现 数据 的 。 所 以 有 人 说 ,数据 是 从 观察 和 
测量 中 所 收集 到 的 事实 ; 也 有 人 说 数据 是 描述 事物 的 符号 记录 ,或 者 说 数据 是 载荷 信息 
的 各 种 符号 ; 还 可 以 说 ,数据 本 质 上 是 对 客观 事物 特征 的 一 种 抽象 ,符号 化 的 表示 , 即 用 
一 定 的 符号 表示 那些 从 观察 或 测量 中 所 收集 到 的 基本 事实 ,采用 何 种 符号 完全 是 一 种 人 
为 的 规定 。 

这 些 数 据 经 过 加 工 处 理 以 后 ,就 能 转变 为 有 助 于 实现 特定 目的 的 信息 。 因 此 又 可 以 说 
信息 是 数据 有 意义 的 表现 ,或 者 说 信息 就 是 数据 的 含义 。 由 此 可 见 , 信 息 实 际 上 是 经 过 处 理 
后 的 数据 ,是 消化 了 的 数据 。 

例如 ,在 现实 世界 中 测量 到 了 一 个 电压 为 220V, 可 以 知道 220 是 一 个 数据 ,220V 是 一 
个 电压 的 信息 。 但 是 ,如 果 不 知 道 220 表示 的 含义 是 什么 ,那么 也 就 不 知道 传递 的 信息 是 人 
么 ,可 以 认为 220 是 一 个 长 度 的 信息 ,也 可 以 说 220 是 一 个 重量 的 信息 。 

由 此 可 见 ,数据 本 身 还 不 能 完全 表达 自身 内 容 , 需 要 经 过 解释 才能 明白 其 含义 ,所 以 数 
据 和 信息 的 解释 是 密 不 可 分 的 , 即 数据 和 信息 联系 密切 。 

对 数据 和 信息 的 概念 理解 以 后 ,下 面 介绍 另外 两 个 概念 ,数据 管理 和 数据 处 理 。 数 据 管 
理 和 数据 处 理 两 个 概念 既 有 区 别 又 有 联系 ,数据 管理 技术 的 好 坏 ,将 直接 影响 数据 处 理 的 
效率 。 

因为 数据 和 信息 概念 联系 密切 ,所 以 数据 处 理 也 可 以 称 为 信息 处 理 。 由 于 数据 处 理 的 
基本 含义 就 是 从 已 知 的 数据 出 发 ,推导 出 新 的 数据 ,新 的 数据 表示 了 新 的 信息 ,新 的 信息 又 
可 以 作为 已 知 数据 进行 进一步 的 处 理 。 所 以 .把 对 数据 进行 收集 、 组 织 、 存 储 、 加 工 、 抽 取 和 
传播 等 一 系列 活动 的 总 和 称 为 数据 处 理 , 其 目的 是 从 大 量 的 原始 数据 中 抽取 、 推 导出 对 人 们 
有 价值 的 信息 。 

一 般 来 说 ,数据 处 理 在 数据 计算 方面 比较 简单 ,但 是 所 涉及 的 数据 量 比较 大 ,数据 结构 
和 数据 之 间 的 联系 比较 复杂 ,所 以 ,数据 处 理 的 重点 不 是 计算 ,而 是 数据 管理 ,这 一 点 也 是 数 
据 处 理 和 科学 计算 的 最 大 差别 。 

数据 管理 是 指 对 数据 的 分 类 组织、 编码 .存储 .查询 和 维护 等 活动 。 这 些 活 动 是 数据 处 
理 的 基本 环节 ,也 是 各 种 业务 数据 处 理 的 共性 部 分 ,所 以 ,可 以 研究 出 来 方便 、 高 效 、 通 用 的 
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管理 软件 ,把 数据 有 效 地 管理 起 来 ,以 便 减 轻 程序 员 的 负担 。 

由 此 可 见 , 数 据 管理 是 数据 处 理 活动 中 的 一 部 分 ,并 且 是 数据 处 理 的 中 心 环节 。 数 据 处 
理 与 数据 管理 是 相 联系 的 ,数据 管理 技术 的 优 劣 将 对 数据 处 理 的 效率 产生 直接 影响 。 数 据 
库 技 术 就 是 针对 数据 管理 进行 研究 ,发展 及 完善 起 来 的 计算 机 应 用 的 一 个 分 支 。 


1.2.2 数据 管理 技术 的 产生 与 发 展 


数据 为 人 类 社会 发 展 提供 了 重要 的 信息 资源 。 如 何 有 效 地 保存 和 科学 地 管理 这 些 数据 
是 人 们 长 期 以 来 十 分 关注 的 课题 ,从 而 促进 了 数据 管理 技术 的 发 展 。 

早期 在 原始 社会 ,人 们 就 利用 木 棍 .石子 和 火光 等 介质 进行 数据 的 收集 、 存 储 和 传播 等 
活动 ,将 它 称 为 原始 阶段 数据 管理 或 数据 处 理 。 后 来 文字 、 纸 张 及 印刷 术 的 发 明 , 使 得 社会 
有 了 飞跃 的 发 展 , 人 们 利用 文字 纸张 作为 介质 进行 存储 和 加 工 等 。 到 了 20 世纪 50 年 代 , 由 
于 计算 机 的 出 现 , 人 们 开始 利用 磁 介 质 进行 存储 .加 工 和 传播 数据 等 活动 ,此 时 把 它 称 为 计 
算 机 数据 管理 。 

计算 机 技术 的 发 展 使 得 数据 管理 技术 也 不 断 向 前 发 展 , 至 今 ,经 历 了 人 工 管理 阶段 . 文 
件 系统 阶段 和 数据 库 系统 阶段 。 

1. 人 工 管 理 阶段 

20 世纪 50 年 代 中 期 以 前 ,很 多 计算 机 只 有 硬件 而 无 软件 。 当 时 的 计算 机 主要 用 于 科 
学 计算 ,一 般 数 据 不 保存 在 计算 机 内 。 尽 管 后 来 有 了 一 些 软件 ,但 也 没有 专用 的 软件 对 数据 
进行 管理 ,例如 ,早期 的 BASIC 将 程序 与 数据 放 在 一 起 ,数据 都 放 在 DATA 语句 中 ,数据 的 
组 织 方式 完全 由 编程 人 员 自 己 设 计 与 安排 。 此 时 ,该 程序 中 的 数据 只 能 为 本 程序 服务 ,并 且 
把 程序 和 数据 放 到 一 起 ,起 名 为 “文件 名 . BAS”。 如 果 程序 有 问题 需要 修改 , 则 当 把 程序 调 
和 内存 时 ,数据 也 被 一 同调 入 。 如 果 想 修改 数据 ,程序 也 必然 要 随 之 调和 人 到 内 存 中 来 ,甚至 ， 
当时 很 多 程序 只 能 在 程序 运行 时 输入 数据 ,并 且 只 能 是 少量 数据 ,所 以 限制 了 数据 处 理 的 应 
用 。 由 此 可 以 看 出 ,程序 和 数据 密 不 可 分 ,如 图 1-5 所 示 。 

由 此 可 见 , 人 工 管 理 阶段 存在 以 下 问题 。 

(1) 数据 不 独立 保存 。 

(2) 应 用 程序 管理 数据 。 

(3) 数据 不 能 够 共享 。 图 1-5 人 工 管理 阶段 

(4) 数据 不 具有 独立 性 。 

(5) 数据 没有 软件 系统 进行 管理 ,程序 员 不 仅 要 规定 数据 的 逻辑 结构 ,还 要 设计 数据 的 
物理 结构 ,数据 面向 应 用 。 

2. 文件 系统 阶段 

在 人 工 管理 阶段 最 明显 的 缺点 就 是 缺乏 数据 独立 性 。 所 以 在 20 世纪 50 年 代 后 期 至 
60 年 代 中 期 , 随 着 计算 机 技术 的 发 展 ,当时 不 但 计算 机 的 硬件 有 了 磁盘 等 直接 存储 设备 , 软 
件 方面 也 有 了 变化 ,在 操作 系统 中 有 了 专门 的 数据 管理 软件 , 称 为 文件 系统 ,所 以 说 数据 管 
理 进 入 文件 系统 阶段 。 

在 文件 系统 阶段 ,程序 与 数据 可 以 分 别 独立 存放 ,数据 可 以 组 成 数据 文件 ,并 且 可 以 独 
立 命名 。 一 旦 命名 之 后 ,程序 便 可 以 通过 文件 名 对 文件 中 的 数据 进行 处 理 ,当然 ,在 程序 与 
数据 之 间 需 要 一 个 转换 过 程 ,但 是 这 个 过 程 可 以 由 文件 管理 系统 完成 , 即 采 用 “应 用 程序 


应 用 程序 1 应 用 程序 2 应 用 程序 n 
数据 1 数据 2 数据 n 


OS 一 数据 文件 ”的 存 取 方式 ,如 图 1-6 所 示 。 


应 用 程序 1 文件 1 
应 用 程序 2 
应 用 程序 n 文件 n 


1-6 文件 系统 管理 阶段 


例如 ,一 个 大 学 下 设 有 很 多 个 学 院 和 处 室 ,一 个 教师 要 和 多 个 部 门 打交道 ,如 人 事 处 、 教 
务 处 .科研 处 .医院 等 ,各 部 门 都 要 掌握 教师 的 有 关 信 息 ,假设 各 部 门 包括 的 部 分 信息 如 
表 1-1 一 表 1-4 所 示 。 

表 1-1 人 事 文件 
编号 姓名 ”性 别 出 生日 期 参加 工作 日 期 职称 ” 职务 基本 工资 


表 1-2 教学 文件 

编号 姓名 性 别 职称 授课 名 称 授课 班级 
表 1-3 科研 文件 

编号 姓名 性 别 职称 项 目 名 称 经 费 
表 1-4 体检 文件 


编号 姓名 性 别 职称 身高 体重 心肺 血压 


这 些 文件 应 该 怎样 组 织 由 用 户 自行 决定 ,每 个 用 户 可 以 建立 、 维 护 和 处 理 一 个 文件 或 多 
个 文件 。 一 个 应 用 程序 可 以 与 一 个 或 多 个 数据 文件 对 应 ,也 可 以 说 ,一 个 或 多 个 数据 文件 为 
某 个 应 用 程序 服务 。 

尽管 文件 系统 使 得 数据 管理 技术 有 了 重要 进展 ,使 得 数据 可 以 长 期 保存 ,可 以 有 专门 的 
文件 系统 软件 进行 数据 管理 ,但 是 仍然 有 很 多 根本 性 问题 没有 解决 ,如 下 列 问题 所 述 。 

(1) 数据 元 余 度 大 、 共 享 性 差 , 易 产生 数据 不 一 致 性 。 

在 文件 系统 中 ,数据 文件 是 用 户 各 自 建立 的 ,为 用 户 自 己 或 用 户 组 所 有 ,所 以 即使 是 相 
同 的 数据 也 必须 放 在 各 自 的 文件 中 ,因此 数据 共享 性 差 , 元 余 度 大 。 同 时 由 于 相同 数据 的 重 
复 存 储 、 各 自 管理 , 易 产 生 数 据 的 不 一 致 性 。 

例如 ,在 表 1-1 一 表 1-4 中 都 有 编号 姓名、 性 别 、 职 称 信息 ,这 显然 造成 了 大 量 数据 的 元 
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余 , 并 且 如 果 该 教师 职称 发 生 了 变化 ,在 人 事 文件 中 改变 了 其 相应 的 职称 信息 ,可 是 在 教学 、 
科研 等 文件 中 没有 被 修改 ,就 会 产生 数据 的 不 一 致 性 。 

这 些 问 题 和 数据 共享 性 差 是 密切 相关 的 ,也 可 以 说 ,共享 性 越 差 ,元 余 度 就 越 高 ,而 元 余 
度 高 就 会 在 修改 过 程 中 带 来 修改 不 一 致 现象 。 

(2) 数据 独立 性 差 。 

数据 独立 性 差 即 应 用 程序 与 数据 之 间 依 赖 性 很 强 。 因 为 数据 文件 完全 是 根据 具体 的 应 
用 程序 的 要 求 而 建立 的 ,文件 系统 中 文件 逻辑 结构 一 旦 需要 修改 ,那么 必须 修改 应 用 程序 。 
由 于 语言 环境 的 变化 要 求 修改 应 用 程序 时 ,也 将 引起 文件 数据 结构 的 改变 ,因此 数据 与 程序 
间 仍 缺乏 数据 独立 性 。 

例如 ,在 表 1-1 中 插入 一 个 所 在 单位 信息 和 年 龄 信息 ,这 将 会 引起 应 用 程序 的 变化 。 

(3) 用 户 负担 重 。 

文件 系统 虽然 为 用 户 提 供 了 一 种 简单 ,统一 的 存 取 文件 的 方法 ,但 文件 的 处 理 、 数 据 的 
安全 性 和 完整 性 得 不 到 可 靠 保 证 ,这 些 必须 由 用 户 程序 完成 。 

例如 ,在 性 别 信 息 中 ,性 别 只 能 是 “ 男 ” 或 “ 女 ”, 如 果 是 其 他 数据 则 不 能 接受 ,但 是 ,关于 
这 个 完整 性 的 控制 必须 由 用 户 程序 完成 。 

IF NOT (性 别 =" 男 " OR 性 别 = " 女 ") 

PRINT "性 别 输入 不 正确 ,性 别 只 能 是 ' 男 ' 或 者 ' 女 " 

ENDIF 

(4) 数据 无 结构 。 

由 于 数据 文件 是 按 位 置 存放 的 ,所 以 记录 之 间 没 有 联系 , 故 是 无 结构 的 。 

除 此 之 外 ,文件 系统 一 般 不 支持 多 个 应 用 程序 对 同一 文件 的 并 发 访问 , 故 数据 处 理 的 效 
率 较 低 。 同 时 ,使 用 方式 不 够 灵活 。 每 个 已 经 建立 的 数据 文件 只 限于 一 定 的 应 用 , 且 难 于 对 
它 进 行 修 改 和 扩充 。 

例如 ,美国 阿波 罗 登 月 计划 ,阿波 罗 飞 船 由 两 百 多 万 个 部 件 组 成 , 且 这 些 部 件 是 由 分 散 
在 世界 各 地 的 若干 厂家 生产 的 。 为 了 掌握 工程 进度 和 协调 工程 进展 ,阿波 罗 计 划 的 主要 合 
作者 Rockwell 公司 ,在 开始 时 曾 研制 了 一 个 基于 磁带 的 零 部 件 生产 计算 机 文件 管理 系统 。 
该 文件 管理 系统 的 数据 元 余 高 达 60% 以 上 , 且 只 能 以 批 处 理 方式 进行 工作 ,系统 维护 也 困 
难 。 这 些 问题 曾 一 度 成 为 实现 阿波 罗 登 月 计划 的 障碍 。 

文件 系统 存在 的 这 些 问题 很 难得 到 解决 ,因此 ,为 了 解决 这 些 问题 ,数据 库 应 运 而 生 , 这 
就 是 数据 库 系统 产生 的 背景 ,也 是 数据 库 技术 的 目标 。 

在 这 里 说 明 一 点 ,文件 系统 管理 阶段 是 数据 管理 发 展 的 一 大 进步 ,直到 现在 仍然 被 
广泛 使 用 ,即使 是 下 面 将 要 介绍 的 数据 库 系统 阶段 ,数据 库 的 方式 也 是 以 文件 方式 为 基 
础 的 。 

3. 数据 库 系 统 阶段 

20 世纪 60 年 代 后 期 以 来 ,为 了 克服 文件 系统 存在 的 问题 ,同时 为 了 适应 日 益 迅 速 增长 
的 数据 处 理 的 需求 ,人 们 开始 探索 新 的 数据 管理 方法 与 工具 。 数 据 库 技 术 应 运 而 生 。 

数据 库 技术 的 目标 主要 是 解决 数据 独立 性 问题 , 即 克服 程序 与 数据 文件 相互 依赖 ,力争 
数据 独立 ,同时 还 需要 尽量 解决 数据 元 余 ,数据 安全 性 、 数 据 完整 性 等 问题 。 因 此 ,出 现 了 统 
一 管理 数据 的 专门 软件 系统 一 一 数据 库 管理 系统 。 


从 文件 系统 发 展 到 数据 库 系统 是 数据 管理 发 展 的 一 个 重大 变革 , 它 将 过 去 在 文件 系统 
中 的 以 程序 设计 为 核心 ,数据 服从 程序 设计 的 数据 管理 模式 改变 为 以 数据 库 设 计 为 核心 ,应 
用 程序 设计 退 居 次 位 的 数据 管理 模式 ,如 图 1-7 所 示 。 


应 用 程序 


应 用 程序 


应 用 程序 


1-7 数据 库 系 统管 理 阶段 


世界 上 第 一 个 数据 库 管 理 系 统 是 美国 通用 电气 公司 (GE) 的 C. W. Bachman 等 人 于 
1964 年 开发 成 功 的 IDS(Integrated Data Store) 系 统 。 为 此 ,Bachman 于 1973 年 获得 了 美 
国 计 算 机 协会 (ACMD) 颁 发 的 图 灵 (Turing) 奖 。IDS 奠定 了 网 状 数据 库 的 基础 ,并 且 得 到 了 
广泛 的 应 用 。 

数据 库 在 发 展 过 程 中 经 历 了 三 个 重要 事件 ,这 三 个 事件 被 称 为 数据 库 系 统 发 展 的 三 个 
里 程 碑 。 

(1) 1968 年 ,美国 IBM 公司 推出 了 世界 上 第 一 个 商品 化 的 数据 库 管理 系统 
(Information Management System,IMS) , 它 是 一 个 典型 的 层次 数据 库 系 统 ,为 阿波 罗 飞 船 
于 1969 年 顺利 登 月 提供 了 重要 保证 。 在 20 世纪 70 年 代 ,IMS 在 商业 、 金 融 系 统 得 到 了 广 
泛 的 应 用 。 

(2) 1969 年 ,美国 数据 系统 语言 委员 会 (Conference On Data System Language， 
CODASYL) 下 属 的 数据 库 任务 组 (Data Base Task Group,DBTG ) 发 表 了 DBTG 报告 。 
DBTG 报告 给 出 了 网 状 数据 库 系统 的 方案 ,并 在 1971 年 正式 通过 了 这 份 报告 ,这 份 报告 为 
建立 网 状 数据 库 提 供 了 完整 的 系统 设计 和 请 言 规范 。 后 来 根据 DBTG 报告 实现 了 很 多 网 
状 数据 库 系统 ,如 IDMS IMAGE 等 。DBTG 系统 在 20 世纪 70 年 代 至 80 年 代 中 期 得 到 了 
广泛 的 应 用 。 

(3) 1970 年 ,美国 IBM 公司 San Jose 研究 所 的 研究 员 E. F. Codd 在 美国 计算 机 协会 会 
刊 Communication of the ACM 上 发 表 了 题 为 “A Relational Model of Data for Shared Data 
Banks”( 大 型 共享 数据 库 数据 的 关系 模型 ) 的 著名 论文 。 之 后 E. F. Codd 相继 又 发 表 了 多 篇 
关于 关系 模型 的 论文 ,定义 了 关系 数据 库 的 基本 概念 ,引进 了 规范 化 理论 , 葛 定 了 关系 数据 
库 的 坚实 理论 基础 。E. F. Codd 作为 关系 数据 库 的 创始 人 和 葛 基 人 ,在 1981 年 11 月 ACM 
(美国 计算 机 协会 ) 洛 杉 矶 年 会 上 , 因 对 数据 库 管理 系统 的 理论 与 实践 做 出 黄 基 性 .持续 性 和 
开拓 性 的 贡献 ,荣获 了 计算 机 科学 的 最 高 荣誉 一 一 图 灵 奖 。 

从 数据 库 系统 发 展 的 三 个 里 程 碑 可 以 看 出 ,描述 客观 世界 的 实体 及 其 相互 联系 的 方法 
可 采用 不 同 的 数据 模型 , 即 用 树 状 结构 描述 的 层次 模型 ,用 网 状 结构 描述 的 网 状 模型 ,以 及 
用 表 结 构 描述 的 关系 模型 ,与 这 些 数据 模型 相对 应 的 数据 库 分 别称 为 层次 型 数据 库 、 网 状 数 
据 库 和 关系 型 数据 库 。 

数据 管理 三 个 阶段 的 比较 如 表 1-5 所 示 。 
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表 1-5 数据 管理 三 个 阶段 的 比较 


人 工 管理 文件 系统 数据 库 系统 
应 用 背景 科学 计算 科学 计算 ,管理 大 规模 管理 
背 | 硬件 背景 无 直接 存 取 存储 设备 | 磁盘 、 磁 鼓 大 容量 磁盘 
软件 背景 没有 操作 系统 有 文件 系统 有 数据 库 管理 系统 
人 处 理 方式 批 处 理 1 人 联机 实时 处 理 , 分布 处 理 批 处 理 
数据 的 管理 者 “| 人 文件 系统 数据 库 管 理 系统 
数据 面向 的 对 象 | 某 一 应 用 程序 某 一 应 用 程序 整个 应 用 系统 
数据 的 共享 程度 | 无 共享 ,元 余 度 极 大 | 共享 性 差 , 宛 余 度 大 | 共享 性 高 ,元 余 度 小 
特 数据 的 独立 性 不 独立 ,完全 依赖 于 独立 性 闫 具有 高 度 的 物理 独立 性 和 逻辑 独 
程序 立 性 
i 结 
训 数据 的 结构 化 | 无 结构 记 时 的 有 二 的 3 六 杠 整体 结构 化 ,用 数据 模型 描述 
无 结构 
由 数据 库 管 理 系统 提供 数据 安全 
数据 控制 能 力 ”| 应 用 程序 自己 控制 ”| 应 用 程序 自己 控制 性 .完整 性 .并 发 控制 和 恢复 能 力 


1.2.3 数据 库 系 统 的 特点 


数据 库 系 统 是 一 个 比较 复杂 的 系统 ,包括 计算 机 的 软件 ,硬件 环境 以 及 数据 库 \ 数 据 库 
管理 系统 ,以 及 数据 库 管 理 员 等 相互 独立 而 又 相互 联系 的 若干 部 分 。 所 以 ,很 难 用 简洁 的 语 
言 概 括 其 全 部 特点 ,但 是 用 数据 库 系统 管理 数据 应 该 具有 以 下 基本 特点 。 

(1) 数据 结构 化 。 

这 一 特点 是 文件 系统 与 数据 库 系统 的 根本 区 别 之 一 。 

在 文件 系统 中 ,在 整体 上 不 存在 结构 化 ,并 且 数 据 的 存放 只 有 程序 员 了 解数 据 的 含义 、 
存放 的 位 置 等 ,而 数据 库 系 统 中 的 数据 是 按照 一 定 的 数据 模型 来 组 织 .描述 和 存储 的 ,数据 
模型 能 够 表示 现实 世界 中 各 种 数据 组 织 和 数据 间 的 联系 。 

由 于 数据 库 是 从 整体 考虑 数据 结构 ,所 以 数据 不 再 是 面向 应 用 而 是 面向 系统 的 。 对 于 
不 同 的 应 用 ,可 以 选取 整体 模型 的 各 种 合理 子 集 加 以 实现 。 

(2) 数据 宛 余 度 小 .共享 性 高 .避免 了 数据 的 不 一 致 性 。 

由 于 相同 的 数据 在 数据 库 中 一 般 只 存储 一 次 ,并 为 不 同 的 应 用 共享 ,所 以 大 大 降低 了 数 
据 的 元 余 度 ,提高 了 共享 性 。 

如 果 一 个 数据 在 不 同 地 方 多 次 存放 ,此 时 如 果 需 要 修改 ,就 必须 对 所 有 地 方 修改 ,一 旦 
漏 掉 一 个 地 方 ,必然 会 产生 数据 不 一 致 性 问题 。 例 如 , 某 一 个 教师 的 职称 为 副教授 ,如 果 在 人 
事 档案 中 在 教学 表 中 ` 在 体检 表 中 等 ,职称 出 现 了 不 同 的 值 , 原 因 就 是 由 于 存在 数据 宛 余 造成 
的 。 但 如 果 一 个 数据 在 数据 库 中 只 存储 一 次 (无 数据 宛 余 ), 则 不 会 产生 数据 不 一 致 性 问题 。 

在 这 里 说 明 一 点 ,从 理论 上 讲 ,数据库 中 的 数据 应 该 是 无 元 余 的 。 然 而 ,在 实际 运行 的 
数据 库 系 统 中 ,为 了 改善 对 数据 库 的 查询 效率 等 ,在 某 种 程度 上 仍然 保留 一 些 重 复数 据 , 称 
这 些 是 可 控 宛 余 度 ,系统 负责 对 元 余数 据 的 检查 和 维护 工作 。 

(3) 具有 较 高 的 数据 独立 性 。 

数据 独立 性 是 指数 据 库 中 数据 与 应 用 程序 的 无 关 性 。 


在 数据 库 系 统 中 ,数据 独立 性 一 般 分 为 数据 的 逻辑 独立 性 和 数据 的 物理 独立 性 。 逻 辑 
独立 性 是 指数 据 的 全 局 逻辑 结构 与 局 部 逻辑 结构 之 间 的 相互 独立 性 。 当 全 局 逻辑 结构 改 
变 时 ,可 以 改变 全 局 逻辑 结构 与 局 部 逻辑 结构 之 间 的 映射 关系 ,而 与 某 个 具体 应 用 相关 
的 局 部 逻辑 结构 不 用 改变 ,从 而 应 用 程序 也 不 用 改变 。 物 理 独 立 性 是 指数 据 的 存储 结构 
与 全 局 逻辑 结构 之 间 的 相互 独立 性 。 当 改变 数据 库 中 的 存储 结构 时 ,不 影响 全 局 逻辑 结 
构 , 只 要 不 改变 全 局 逻辑 结构 ,就 不 改变 应 用 程序 ,所 以 ,在 数据 库 系统 中 具有 较 高 的 数 
据 独立 性 。 

关于 数据 独立 性 的 体现 ,在 介绍 数据 库 系统 体系 结构 时 会 对 这 一 特点 有 进一步 的 认识 。 

(4) 数据 由 DBMS 统一 管理 和 控制 。 

在 文件 系统 中 ,虽然 数据 由 操作 系统 中 的 文件 系统 管理 ,但 是 缺乏 安全 性 、 完 整 性 等 控 
制 。 而 数据 库 系统 则 能 通过 数据 库 管 理 系 统 集中 地 控制 和 管理 数据 ,在 数据 库 系统 中 设 有 
数据 库 管 理 员 (Database Administrator,DBA) ,由 数据 库 管 理 员 对 数据 库 进行 管理 和 维护 。 
数据 库 管 理 系 统 还 提供 如 下 数据 控制 功能 。 

@ 数据 的 安全 性 (Security) 保 护 。 

数据 的 安全 性 是 指 保护 数据 以 防止 不 合法 的 使 用 而 造成 数据 的 泄密 和 破坏 。 

数据 库 系 统 通常 采取 用 户 标 识 与 鉴别 和 存 取 控制 措施 实现 安全 保护 。 用 户 标识 与 鉴别 
是 每 次 用 户 要 求 进入 系统 时 ,由 系统 进行 核对 ,只 有 合法 用 户 才 可 以 具有 使 用 权 。 存 取 控 制 
是 确保 只 授权 给 有 资格 的 用 户 访 问 数据 库 的 权限 。 数 据 库 用 户 按 照 其 访问 权力 的 大 小 ,一 
般 可 以 分 为 一 般 数 据 库 用 户 数据库 的 拥有 者 、 有 DBA 特权 的 用 户 。 不 同 权限 的 用 户 由 于 
权限 不 同 , 所 访问 到 的 数据 库 中 的 数据 不 同 ,从 而 起 到 了 安全 保护 作用 。 

@ 数据 的 完整 性 (Integrity) 保 护 。 

数据 的 完整 性 是 指 将 数据 控制 在 有 效 范围 内 或 使 数据 之 间 满 足 一 定 的 关系 ,以 保证 数 
据 的 正确 性 有 效 性 和 相 容 性 , 即 为 了 防止 数据 库 中 存在 不 符合 语义 的 数据 ,防止 错误 信息 
的 输入 和 输出 。 例 如 ,教师 的 编号 一 定 是 唯一 的 ; 性 别 只 能 是 “ 男 ” 或 “ 女 ”; 姓名 长 度 的 规 
定 、 类 型 的 规定 等 。 这 些 都 是 在 操作 过 程 中 必须 满足 的 条 件 。 

@ 并 发 控制 (Concurrency Control) 。 

对 并 发 操作 如 果 不 加 控制 可 能 会 引发 一 些 问 题 。 例 如 ,火车 售票 系统 ,假设 目前 有 多 个 
售票 窗口 要 对 同一 个 车 次 的 同一 张 车 票 进行 出 售 , 如 果 对 这 种 并 发 操作 不 进行 控制 ,就 有 可 
能 发 生 同 一 个 车 票 被 多 个 旅客 所 购买 。 这 种 现象 称 为 数据 丢失 修改 。 除 此 之 外 ,并 发 操作 
还 会 带 来 读 “ 脏 ”数据 和 不 可 重复 读 等 问题 。 所 以 , 当 多 个 用 户 的 并 发 进程 同时 对 数据 库 进 
行 存 取 时 ,必须 对 多 用 户 的 并 发 操作 加 以 控制 和 协调 。 

@ 数据 库 恢 复 (Recovery) 。 

当 数 据 库 系统 发 生 故障 时 ,DBMS 必须 具有 将 数据 库 从 错误 状态 恢复 到 某 个 正确 状态 
的 功能 。 

数据 库 恢 复 机 制 是 为 了 保证 事务 的 原子 性 和 持久 性 。 当 系统 发 生 故 障 时 ,有 些 事务 没 
有 完成 就 被 迫 停止 ,这些 未 完成 的 事务 所 做 的 操作 可 能 已 对 数据 库 造 成 影响 ,使 数据 库 处 于 
不 一 致 的 状态 。 因 此 ,就 需要 DBMS 的 恢复 机 制 撤 销 所 有 未 完成 事务 对 数据 库 的 一 切 影 
响 ,保证 事务 的 原子 性 。 同 样 ,对 已 提交 的 事务 要 恢复 它 对 数据 的 更 改 , 保 证 事务 的 持久 性 。 
因此 ,DBMS 所 采用 的 恢复 技术 是 否 行 之 有 效 ,不 仅 对 系统 的 可 靠 程度 起 着 决定 性 的 作用 ， 
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而 且 对 系统 的 运行 效率 也 有 很 大 影响 ,是 衡量 系统 性 能 优 劣 的 重要 指标 。 

数据 库 系统 中 可 能 发 生 的 故障 很 多 ,如 事务 故障 、 系 统 故障 和 介质 故障 。 恢 复数 据 库 的 
基本 原理 很 简单 ,就 是 数据 库 中 的 任何 一 部 分 被 破坏 的 或 不 正确 的 数据 可 以 根据 存储 在 系 
统 别处 的 元 余数 据 来 重建 。 最 常用 的 元 余数 据 有 后 备 副 本 和 日 志文 件 。 尽 管 恢复 的 基本 原 
理 简 单 ,但 实现 的 细节 却 相 当 复 杂 。 


1.3 数据 模型 


1.3.1 数据 模型 的 几 个 重要 问题 


1. 定义 

关于 模型 读者 并 不 陌生 ,如 汽车 模型 .飞机 模型 .建筑 模型 等 。 模 型 就 是 现实 世界 特征 
的 模拟 和 抽象 。 

在 数据 库 技术 中 ,数据 模型 是 指 现实 世界 数据 和 信息 的 模拟 和 抽象 ,用 来 描述 数据 、 组 
织 数据 和 对 数据 进行 操作 。 现 有 的 数据 库 系 统 均 是 基于 某 种 数据 模型 的 ,数据 模型 是 数据 
库 系统 的 核心 和 基础 。 

2. 数据 模型 应 该 满足 的 要 求 

用 计算 机 模拟 现实 世界 人 们 的 各 种 事务 管理 活动 ,一 般 需 要 经 历 : 对 现实 世界 的 事务 
进行 分 析 , 抽 象 成 概念 模型 ,然后 将 概念 数据 模型 转换 为 便于 计算 机 进行 处 理 的 逻辑 数据 模 
型 ,最 后 将 逻辑 数据 模型 转换 为 计算 机 能 实现 的 存储 模型 。 这 一 过 程 如 图 1-8 所 示 。 


CET DLS 抽象 | 信息 世界 | 转换 数据 世界 
概念 模型 ~ 支持 的 数据 模型 


图 1-8 现实 世界 到 计算 机 世界 的 抽象 过 程 


因此 ,无 论 是 数据 库 的 设计 ,还 是 DBMS 的 实现 ,都 需要 数据 模型 ,以 达到 将 现实 系统 
向 计算 机 化 管理 转变 的 目标 。 

在 从 现实 世界 到 计算 机 世界 的 抽象 过 程 中 ,必须 满足 如 下 要 求 。 

(1) 真实 性 。 要 求 能 够 真实 地 模拟 现实 世界 ,也 只 有 真实 地 反映 出 现实 世界 所 对 应 的 
要 求 才 是 有 意义 的 ,否则 是 空洞 的 .虚假 的 和 无 意义 的 。 

(2) 易 理 解 性 。 对 现实 世界 模拟 以 后 ,可 以 抽象 出 概念 模型 ,对 于 概念 模型 所 描述 的 内 
容 是 否 正 确 ,需要 和 现实 世界 的 用 户 进 行 交流 ,如 果 概 念 模型 用 户 不 理解 ,就 无 法 沟通 , 因 
此 ,要 求 概念 模型 应 具备 易 理 解 性 。 同 时 ,概念 模型 还 要 向 数据 模型 转换 ,如 果 不 具备 易 理 
解 性 ,设计 者 也 将 会 出 现 困惑 。 

(3) 易 实现 性 。 易 实现 性 主要 针对 概念 模型 和 数据 模型 , 即 如 何 能 够 使 概念 模型 便于 
转换 为 数据 模型 ,同时 数据 模型 又 方便 在 计算 机 上 实现 。 

如 果 一 个 数据 模型 能 够 同时 满足 上 述 三 个 要 求 , 就 可 以 评价 该 数据 模型 是 一 个 优秀 的 
数据 模型 。 实 际 上 ,这 三 个 要 求 是 由 数据 模型 所 处 的 地 位 和 担负 的 角色 所 决定 的 。 

3. 数据 模型 的 分 类 

数据 模型 的 种 类 很 多 ,如 果 按 不 同 的 应 用 层次 可 以 分 成 三 种 类 型 ,分 别 是 概念 数据 模 


型 .逻辑 数据 模型 、 物 理 数据 模型 。 

(1) 概念 数据 模型 : 简称 概念 模型 ,是 独立 于 计算 机 系统 的 数据 模型 ,完全 不 涉及 信息 
在 计算 机 中 的 表示 ,是 面向 数据 库 用 户 的 现实 世界 模型 ,主要 用 来 描述 现实 世界 的 概念 化 结 
构 。 它 使 数据 库 的 设计 人 员 在 设计 的 初始 阶段 ,摆脱 了 计算 机 系统 及 DBMS 的 具体 技术 问 
题 , 集 中 精力 分 析 数 据 以 及 数据 之 间 的 联系 等 ,与 具体 的 DBMS 无 关 。 在 概念 数据 模型 中 
最 常用 的 是 E-R 模型 .扩充 的 E-R 模型 和 谓词 模型 等 。 

(2) 逻辑 数据 模型 : 简称 数据 模型 ,这 是 用 户 从 数据 库 所 看 到 的 模型 ,是 具体 的 DBMS 
所 支持 的 数据 模型 ,如 层次 数据 模型 .网 状 数据 模型 .关系 模型 和 面向 对 象 模 型 均 属 于 这 类 
数据 模型 。 此 类 模型 既 要 面向 用 户 , 又 要 面向 系统 ,主要 用 于 DBMS 的 实现 。 

(3) 物理 数据 模型 : 简称 物理 模型 ,是 对 数据 最 底层 的 抽象 ,描述 数据 在 系统 内 部 的 表 
示 方 式 和 存 取 方法 ,在 磁盘 或 磁带 上 的 存储 方式 和 存 取 方法 ,是 面向 计算 机 系统 的 。 它 是 面 
向 计算 机 物理 表示 的 模型 ,不 但 与 具体 的 DBMS 有 关 , 还 与 操作 系统 和 硬件 有 关 。 每 一 种 
逻辑 数据 模型 在 实现 时 都 有 对 应 的 物理 数据 模型 。DBMS 为 了 保证 其 独立 性 与 可 移植 
性 ,大 部 分 物理 数据 模型 的 实现 工作 由 系统 自动 完成 ,而 设计 者 只 设计 索引 、 聚 集 等 特殊 
结构 。 

4. 数据 模型 的 组 成 要 素 

数据 库 专家 E. F. Codd 认为 ,一 个 基本 数据 模型 是 一 组 向 用 户 提供 的 规则 ,这 些 规则 
规定 数据 结构 如 何 组 织 以 及 允许 进行 何 种 操作 。 通 常 ,一 个 数据 库 的 数据 模型 应 包含 数据 
结构 ,数据 操作 和 数据 完整 性 约束 三 个 部 分 。 

(1) 数据 结构 。 数 据 结 构 是 指 对 实体 模型 和 实体 间 联 系 的 表达 和 实现 。 数 据 结构 规定 
了 如 何 描述 数据 的 类 型 .内容 .性 质 和 数据 之 间 的 相互 关系 。 它 是 数据 模型 最 基本 的 组 成 部 
分 ,规定 了 数据 模型 的 静态 特性 。 在 数据 库 系 统 中 通常 按照 数据 结构 的 类 型 来 命名 数据 模 
型 ,例如 采用 层次 型 数据 结构 .网 状 数据 结构 .关系 型 数据 结构 的 数据 模型 分 别称 为 层次 模 
型 .网 状 模型 和 关系 模型 。 

(2) 数据 操作 。 数 据 操作 是 指 一 组 用 于 指定 数据 结构 的 任何 有 效 实例 执行 的 操作 或 推 
导 规 则 。 数 据 库 中 主要 的 操作 有 查询 和 更 新 (插入 、 删 除 .修改 ) 两 大 类 。 数 据 模型 要 为 这 些 
操作 定义 确切 的 含义 .操作 规则 和 实现 操作 的 语言 。 因 此 ,数据 操作 规定 了 数据 模型 的 动态 
特性 。 

(3) 数据 完整 性 约束 。 数 据 完整 性 给 出 数据 及 其 联系 应 具有 的 制约 和 依赖 规则 , 它 定 
义 了 给 定数 据 模型 中 数据 及 其 联系 所 具有 的 制约 和 依存 规则 ,用 以 限定 相 容 的 数据 库 状态 
的 集合 和 可 允许 的 状态 改变 ,以 保证 数据 库 中 数据 的 正确 性 有效 性 和 相 容 性 。 

数据 结构 数据 操作 和 数据 的 约束 条 件 是 数据 模型 的 三 要 素 , 其 中 ,数据 结构 是 描述 一 
个 模型 性 质 的 最 重要 的 方面 。 


1.3.2 实体 -联系 数据 模型 


概念 模型 是 从 现实 世界 到 计算 机 世界 转换 的 一 个 中 间 层 次 ,在 数据 库 设计 的 过 程 中 它 
是 比较 关键 的 一 步 。 因 此 ,概念 模型 必须 能 够 真实 地 反映 现实 世界 中 被 管理 事物 的 特征 及 
其 复杂 的 联系 , 即 应 该 具有 丰富 的 语义 表达 能 力 和 直接 模拟 现实 世界 的 能 力 , 且 具 有 直观 、 
自然 .语义 丰富 、 易 于 用 户 理解 的 特点 。 目 前 ,被 广泛 应 用 的 概念 模型 是 E-R 数据 模型 
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(Entity-Relationship Data Model) , 即 实体 -联系 数据 模型 , 它 主 要 用 于 数据 库 的 设计 。 尽 管 
E-R 数据 模型 目前 受到 来 自 对 象 模 型 的 严峻 挑战 ,但 仍 得 到 大 量 用 户 以 及 CASE 工具 的 
支持 。 

1. 信息 的 三 个 领域 

1) 现实 世界 

现实 世界 是 存在 于 人 们 头脑 之 外 的 客观 世界 ,在 这 里 所 说 的 现实 世界 是 指 人 们 的 各 种 
事务 管理 活动 。 研 究 分 析 现 实 世 界 事物 的 规律 和 特点 ,是 建立 概念 模型 的 基础 。 

因为 现实 世界 由 各 种 各 样 的 实体 组 成 ,所 以 ,最 关心 的 是 实体 、 实 体 特性 、 实 体 集 和 实体 
标识 符 。 

(1) 实体 (Entity) : 实体 是 客观 存在 并 可 相互 区 别 的 个 体 。 实 体 可 以 是 具体 的 对 象 ,也 
可 以 是 抽象 的 ; 可 以 是 有 生命 的 ,也 可 以 是 无 生命 的 。 例 如 ,一 名 学 生 、 一 名 教师 .学 生 选 
课 .银行 卡 、. 火 车 票 一 张 桌子 .一 台 计 算 机 、 一 场 文艺 演出 .一 场 体育 比赛 等 。 

(2) 实体 特性 (Entity Character) : 任何 一 个 实体 都 具有 它 自 己 的 特征 或 性 质 , 如 描述 
学 生 的 特征 有 学 号 、. 姓 名 、 性 别 、 年 龄 .身高 和 体重 等 ,描述 财务 明细 账 的 特征 有 日 期 .凭证 
号 摘要、 对方 科目 .余额 .借方 和 贷方 等 ,描述 银行 卡 的 特征 有 银行 卡号 . 卡 持 有 者 的 姓名 、 
卡 的 类 型 和 开户 行 等 。 描 述 实体 的 主要 特征 的 这 一 特性 称 为 实体 特性 。 

(3) 实体 集 (Entity Sets) : 在 数据 库 设计 中 ,常常 关心 具有 相同 实体 特性 实体 的 集合 ， 
这 种 具有 相同 实体 特性 的 一 类 实体 的 集合 称 为 实体 集 ,如 全 校 学 生 的 集合 组 成 学 生 实 体 集 ， 
仓库 管理 中 的 入 库 单 集 合 组 成 入 库 单 实体 集 。 

(4) 实体 标识 符 (Entity Identifier) : 在 实体 集中 唯一 能 确定 实体 集中 某 个 实体 的 最 小 
实体 特性 集 称 为 实体 标识 符 。 例 如 ,在 学 生 实 体 集中 学 号 能 够 唯一 确定 某 一 个 学 生 , 所 以 ， 
学 号 特性 就 是 实体 标识 符 ; 在 财务 明细 账 中 凭证 号 就 是 实体 标识 符 ; 银行 卡号 唯一 确定 某 
张 银行 卡 等 。 但 是 特别 强调 实体 标识 符 不 一 定 是 由 一 个 实体 特性 组 成 的 ,如 果 一 个 实体 特 
性 标识 不 出 来 实体 集中 某 个 实体 ,就 必须 增加 其 他 实体 特性 进行 标识 。 同 样 ,如 果 多 个 实体 
特性 能 够 唯一 标识 实体 集中 某 个 实体 ,可 是 去 掉 某 个 实体 特性 也 能 够 唯一 标识 实体 集中 某 
个 实体 ,这 也 不 能 称 为 实体 标识 符 。 

2) 信息 世界 

现实 世界 中 的 实体 ,通过 人 们 的 感觉 器 官 反 映 到 人 们 的 头脑 中 ,形成 信息 ,组 成 信息 世 
界 。 简 单 地 说 就 是 现实 世界 在 人 们 头脑 中 的 反映 。 在 信息 世界 里 用 实体 记录 表示 实体 ,用 
实体 记录 集 表示 实体 集 , 属 性 表示 实体 集 的 特性 ,用 标识 属性 表示 一 个 实体 标识 符 。 

在 这 些 概念 中 ,属性 是 最 常用 的 术语 ,所 以 有 关 属 性 做 如 下 几 点 说 明 。 

(1) 一 个 实体 记录 可 以 有 若干 个 属性 ,但 是 在 研究 某 一 实体 记录 时 ,只 关心 那些 感 兴趣 
的 属性 。 例 如 ,如 果 要 描述 有 关 学 生 学 习 成 绩 的 话 ,身高 .体重 等 属性 尽管 是 描述 学 生 的 主 
要 特征 ,但 是 和 学 生 学 习 成 绩 无 关 ,因此 就 没有 必要 关心 。 

(2) 不 能 再 细 分 的 属性 称 为 原子 属性 ,如 性 别 、 年 龄 .姓名 等 。 可 以 再 细 分 的 属性 称 为 
可 分 属性 ,如 属性 简历 可 以 进一步 细 分 为 工作 简历 .培训 简历 等 ,工作 简历 又 可 以 分 为 起 始 
时 间 、 结 束 时 间 、 工 作 单位 .证 明 人 等 。 原 子 属性 与 可 分 属性 之 间 具 有 相对 性 ,例如 ,出 生日 
期 ,可 以 把 它 看 作 原 子 属性 ,即将 出 生日 期 当 作 一 个 整体 去 处 理 , 但 如 果 在 数据 操作 过 程 中 ， 
对 出 生日 期 中 的 年 份 .月 份 更 加 关心 的 话 , 在 数据 库 设 计 中 也 可 以 把 它 看 作 可 分 属性 。 所 


以 ,在 数据 库 设 计 中 到 底 如 何 合理 考虑 属性 非常 重要 ,因为 许多 事物 的 特征 也 是 相对 的 , 同 
时 又 需要 从 不 同 的 角度 来 描述 事物 ,因此 在 实际 情况 中 ,要 根据 具体 问题 来 使 用 属性 的 

(3) 属性 有 型 与 值 之 分 ,属性 的 具体 表现 称 为 属性 值 。 如 性 别 就 是 一 个 属性 的 型 ,而 
男 、 女 就 是 性 别 属性 的 值 。 属 性 值 是 附属 于 属性 的 ,有 什么 样 的 属性 ,就 有 什么 样 的 值 , 即 属 
性 的 型 是 相对 稳定 的 ,属性 的 值 随 属性 型 相对 变化 ,在 某 种 情况 下 是 原子 的 ,在 另外 一 种 情 
况 下 又 是 可 分 的 。 如 性 别 在 不 考虑 年 龄 的 情况 下 ,属性 值 是 男 、 女 ,它们 是 原子 的 ,如 果 考 虑 
到 年 龄 ,女性 又 分 为 幼女 、 女 童 、 女 青年 、 女 中 年 、 女 老年 等 。 

(4) 每 个 属性 值 都 有 一 定 的 变化 范围 。 属 性 取 值 的 范围 称 为 值 域 (Domain)。 例 如 ,性 
别 属性 的 值 域 是 男 、 女 ,成 绩 属性 的 值 域 是 0 一 100。 

属性 的 概念 在 数据 库 设计 中 非常 重要 ,到 底 把 某 个 属性 看 作 原 子 属性 还 是 可 分 属性 ,到 
底 是 列 为 属性 型 还 是 属性 值 , 对 数据 库 设 计 会 有 很 大 影响 。 

3) 计算 机 世界 

在 信息 世界 中 有 些 信息 可 以 直接 用 数字 表示 ,有 些 信 息 可 以 用 符号 ,文字 等 来 表示 。 但 
在 计算 机 世界 中 一 切 信息 只 能 用 二 进 制 数据 表示 , 即 在 计算 机 世界 中 的 信息 必须 是 数字 化 
的 。 因 此 ,计算 机 世界 也 称 为 数据 世界 。 

在 计算 机 世界 中 常 使 用 下 列 术语 。 

(1) 记录 (Record) : 信息 世界 中 的 实体 记录 在 计算 机 世界 中 的 表示 ,对 应 的 是 现实 世 
界 的 实体 。 

(2) 字段 (Field) : 信息 世界 中 的 属性 在 计算 机 中 的 表示 , 它 是 可 以 命名 的 最 小 信息 单 
位 ,对 应 的 是 现实 世界 的 实体 特性 。 

(3) 文件 (File) : 信息 世界 中 的 实体 记录 集 在 计算 机 世界 中 的 表示 ,对 应 的 是 现实 世界 
的 实体 集 。 

(4) 关键 字 (Key Word) : 关键 字 能 够 唯一 标识 文件 中 的 某 一 个 记录 的 最 小 字段 集 , 对 
应 的 是 现实 世界 的 实体 标识 符 。 

三 个 世界 中 的 术语 经 常 混在 一 起 说 ,但 说 得 比较 多 的 是 实体 (这 里 的 实体 实质 上 是 实体 
集 的 简称 ,因为 关心 的 不 是 某 一 个 个 体 ,而 是 一 个 整体 )、 属 性 ,关键 字 。 

表 1-6 列 出 了 三 个 不 同 世界 对 同一 个 概念 的 不 同 术 语 。 


表 1-6 三 个 世界 所 用 术语 及 其 对 应 关系 


现实 世界 信息 世界 计算 机 世界 
实体 集 实体 记录 集 表 
实体 实体 记录 记录 
实体 特征 属性 字段 
实体 标识 符 标识 属性 关键 字 


2. 实体 ( 集 ) 间 的 联系 

在 现实 世界 中 实体 集 不 是 孤立 存在 的 ,它们 之 间 的 联系 是 错综复杂 的 ,所 以 ,在 信息 世 
界 中 不 但 要 关心 每 一 个 实体 集 、 属 性 ,还 要 关心 实体 集 之 间 的 联系 。 联 系 分 为 两 类 ,一 类 是 
实体 内 部 的 联系 ,反映 的 是 一 部 分 属性 值 与 男 一 部 分 属性 值 之 间 的 决定 关系 或 依赖 关系 , 即 


雪 论 


坤 一 蛋 
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字段 间 的 联系 。 另 一 类 是 实体 集 间 的 联系 ,反映 在 数据 上 就 是 记录 间 的 联系 。 

关于 实体 内 部 的 联系 重点 关心 的 是 关键 字 , 它 起 到 决定 作用 ,其 他 属性 依赖 关键 字 , 由 
于 在 规范 化 理论 中 要 进行 详细 讨论 ,所 以 在 这 里 重点 讨论 实体 间 的 联系 。 根 据 参 与 联系 的 
实体 集 的 数目 不 同 ,把 联系 分 为 二 元 联系 和 多 元 联系 。 

(1) 二 元 联系 : 只 有 两 个 实体 集 参与 的 联系 称 为 二 元 联系 。 二 元 联系 有 以 下 三 种 
类 型 。 

@ 一 对 一 联系 。 

设 有 两 个 实体 集 A、B, 如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,B 中 至 多 有 一 个 实体 与 之 
有 联系 ,反之 亦 然 , 则 称 A、B 有 一 对 一 联系 (1 : 1 联系 ) 。 

例如 ,学 校 实体 集 A 与 校长 实体 集 B 间 的 联系 是 1: 1 的 。 因 为 一 个 学 校 只 有 一 
长 ( 正 校长 ), 反 过 来 ,一 个 校长 只 对 应 一 个 学 校 , 即 一 个 校长 只 能 在 一 个 学 校 担任 校长 职务 。 
图 1-9 表示 了 一 对 一 联系 。 

实体 集 A 实体 集 B 


sa 


1-9 一 对 一 联系 


学 校 |- 一 | 校 


@ 一 对 多 联系 。 

设 有 两 个 实体 集 A、B, 若 A 中 每 个 实体 与 B 中 任意 个 实体 (包括 零 个 ) 相 联系 ,而 B 中 
每 个 实体 至 多 和 A 中 一 个 实体 有 联系 , 则 称 A 和 B 是 一 对 多 联系 (1 : n 联系 )。 

例如 ,学 校 实体 集 A 与 学 生 实体 集 B 间 的 联系 是 1 :7 的 。 因 为 一 个 学 校 可 以 有 多 个 
学 生 , 反 过 来 ,一 个 学 生 只 对 应 一 个 学 校 。 再 如 ,工厂 与 职工 公司 与 职员 ,班长 与 同学 .教练 
与 运动 员 等 都 是 1 : n 的 联系 。 

把 1:n 联系 倒转 过 来 便 成 为 n : 1 的 联系 。 例 如 ,学 生 实体 集 与 学 校 实体 集 之 间 的 联 
系 是 n: 1 的 。 图 1-10 表示 了 一 对 多 联系 。 

实体 集 A 实体 集 B 


学 校 -一 | 学 生 


1-10 一 对 多 联系 


@ 多 对 多 联系 。 

设 有 两 个 实体 集 A、B, 若 两 个 实体 集 A、B 中 的 每 一 个 实体 都 和 另 一 个 实体 集中 任意 个 
实体 (包括 零 个 ) 有 联系 , 则 称 A、B 是 多 对 多 联系 (m : nn 联系 )。 

例如 ,教师 实体 集 A 与 学 生 实体 集 B 间 的 联系 是 m : n 的 。 因 为 教师 实体 集中 的 任何 
一 个 教师 可 以 有 多 个 学 生 ( 也 可 能 一 个 学 生 也 没有 ) ,而 学 生 实体 集中 的 每 一 个 学 生 也 可 以 


有 多 个 教师 。 再 如 ,学 生 与 课程 .教师 与 课程 图 书 与 借 书 人 等 都 是 m:n 的 联系 。 图 1-11 
表示 了 多 对 多 联系 。 


实体 集 A 实体 集 B 


[2 
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“二 教师 | 一 | 学 生 | 


Ce 


1-11 多 对 多 联系 


1: 1 联系 是 1 :nn 联系 的 特例 ,而 1 :nn 联系 又 是 m:n 联系 的 特例 。 它 们 之 间 的 包含 
关系 如 图 1-12 所 示 。 

(2) 多 元 联系 : 参与 联系 的 实体 集 的 个 数 之 3 时 , 称 为 多 元 联系 。 与 二 元 联系 一 样 ,多 
元 联系 也 可 区 分 为 1 : 1、1 :nn 和 m:n 三 种 。 例 如 ,用 来 描述 学 生 、 教 师 和 课程 实体 集 之 间 
的 “教学 ?联系 是 三 元 联系 ,一 个 教师 可 以 讲授 多 门 课 程 , 并 且 可 以 有 多 个 学 生 学 习 该 课程 ; 
一 门 课程 不 但 可 以 有 多 个 学 生 学 习 , 还 可 以 有 多 名 教师 来 讲授 ; 一 个 学 生 可 以 有 多 个 教师 


为 其 讲授 多 门 课程 ,如 图 1-13 所 示 。 
教师 < 各 > 课程 


学 生 


图 1-12 二 元 联系 的 包含 关系 图 1-13 三 元 关系 


除了 上 述 二 元 联系 和 三 元 联系 以 外 ,还 有 一 种 联系 叫 自 反 联系 , 它 描 述 了 同一 实体 集 内 
两 部 分 实体 之 间 的 联系 ,是 一 种 特殊 的 二 元 联系 。 两 部 分 实体 之 间 的 联系 也 可 以 区 分 为 
1:1.1:n 和 m:n 三 种 。 例 如 ,在 “学 生 " 这 一 实体 集中 存在 班长 与 同学 之 间 1 : m 的 联 
系 ; 在 课程 实体 集中 存在 一 门 课程 与 男 外 一 门 (或 几 门 ) 课 程 之 间 的 先 修 课 联系 。 

关于 实体 集 之 间 的 联系 ,语义 起 到 很 大 作用 ,也 可 以 说 是 现实 世界 的 实际 情况 的 真实 体 
现 。 例 如 ,一 个 班主 任 只 能 带 一 个 班级 ,一 个 班级 只 能 有 一 个 班主 任 , 那 么 班主 任 和 班级 之 
间 就 是 1: 1 的 关系 ; 但 是 如 果 一 个 班主 任 可 以 带 多 个 班级 ,一 个 班级 只 能 有 一 个 班主 任 ， 
那么 班主 任 和 班级 之 间 就 是 1: m 的 关系 。 

3. E-R 图 

关于 概念 模型 的 表示 方法 有 很 多 .最 著名 的 是 实体 -联系 方法 ,简称 E-R 图 (Entity- 
Relationship Approach) 。E-R 图 具有 以 下 优点 : 能 非常 自然 地 描述 现实 世界 ; 图 形 结构 简 
单 ; 设计 者 和 用 户 易 理解 ,并 且 可 以 互相 交流 ; 它 是 数据 库 设 计 的 中 间 步 又 ,易于 向 数据 模 
型 转换 。 

1) E-R 图 的 图 形 符号 

方 框 : 表示 一 个 实体 集 。 在 框 内 写 上 实体 集 的 名 字 。 

菱形 框 : 表示 联系 。 萎 形 框 内 标明 联系 名 ,与 其 相关 的 实体 集 之 间 用 第 头 表 示 ,一 个 箭 
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代表 为 1, 两 个 箭头 代表 为 多 (说 明 : 有 不 少 书 中 用 无 向 边 连接 , 且 在 连 线 边 上 标明 联系 类 型 ) 。 


一 个 一 表示 1 : 1 的 联系 
一 个 一 一 表示 1 : 的 联系 


一 二 个 一 一 表示 m : nn 的 联系 
椭圆 框 : 表示 属性 。 在 框 内 写 上 属性 的 名 字 , 并 用 无 向 边 连 向 与 其 相关 的 实体 集 或 


联系 。 


jm 


在 E-R 图 中 ,有 时 为 了 突出 各 实体 集 之 间 的 联系 ,可 以 先 画 出 实体 集 及 其 属性 ,然后 再 


点 画 出 实体 之 间 的 联系 ,如 图 1-14 和 图 1-15 所 示 。 


院 系 教师 


聘任 < 
| 


教师 学 生 


图 1-14 学 生 实体 及 其 属性 图 1-15 实体 之 间 的 联系 


2) 绘制 E-R 图 的 步骤 

第 一 步 : 通过 对 现实 世界 的 分 析 抽象 以 后 , 找 出 实体 集 及 其 属性 。 

第 二 步 : 找 出 实体 集 之 间 的 联系 。 

第 三 步 : 找 出 实体 集 联系 的 属性 。 

第 四 步 : 绘制 E-R 图 。 绘制 E-R 图 一 般 先 绘制 局 部 E-R 图 ,然后 绘制 全 局 E-R 图 , 详 


细 步 骤 见 数据 库 设 计 。 


例如 ,下 面 以 教学 情况 为 例 , 进 行 E-R 图 设计 。 

(1) 首先 找 出 相关 实体 集 有 : 学 生 (S) ,教师 (T) ,课程 (C) , 院 系 (D) 。 

每 个 实体 的 属性 分 别 如 下 。 

S: 学 号 ,学 生 姓 名 ,出 生日 期 ,专业 ,班级 。 

T: 编号 ,教师 姓名 ,职称 ,所 在 教研 室 。 

C: 课程 号 ,课程 名 称 , 学 时 ,考核 方式 。 

D: 院 系 代号 , 院 系 名 称 。 

(2) 找 出 实体 集 之 间 的 联系 。 

S 与 C 之 间 有 联系 ,有 目 为 m:n, 因为 一 个 学 生 可 以 学 习 很 多 门 课 程 , 反 过 来 一 门 课程 可 


以 被 多 个 学 生 所 学 习 。 


T 与 C 之 间 有 联系 ,上 且 为 m:n, 因 为 一 个 教师 可 以 讲授 很 多 门 课程 , 反 过 来 一 门 课程 


可 以 被 多 个 教师 所 讲授 。 


i 


D 与 S 之 间 有 联系 , 且 为 1 :nn, 因 为 一 个 院 系 可 以 有 很 多 学 生 , 但 是 一 个 学 生 只 属于 一 
院 系 。 
D 与 工 之 间 有 联系 , 且 为 1 : n, 因 为 一 个 院 系 可 以 有 很 多 教师 ,但 是 一 个 教师 只 属于 一 


个 院 系 。 


(3) 找 出 实体 集 之 间 联 系 的 属性 。 
S 与 C 之 间 联 系 的 结果 用 成 绩 表 示 。 
工 与 C 之 间 联 系 以 讲授 哪 一 个 班级 来 表示 。 


(4) 绘制 E-R 图 。 


当 E-R 图 比较 复杂 时 ,为 了 使 E-R 图 简洁 ,可 以 使 属性 不 在 E-R 图 中 出 现 , 即 单独 画 出 
每 一 个 实体 及 实体 属性 ,在 E-R 图 中 仅 画 出 实体 集 和 它们 之 间 的 联系 ,在 E-R 图 中 每 一 个 
实体 只 允许 出 现 一 次 ,如 图 1-16 所 示 。 


课程 


归属 


授课 


图 1-16 教学 情况 ER 图 
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说 明 : E-R 图 的 设计 不 是 唯一 的 ,例如 ,在 分 析 现 实 世 界 时 ,考虑 问题 有 这 样 的 抽象 ,一 
个 院 系 有 很 多 专业 ,一 个 专业 有 很 多 班级 ,一 个 班级 有 很 多 学 生 …… ,那么 这 个 时 候 的 
E-R 图 和 上 述 就 有 区 别 了 (读者 可 以 自己 画 出 满足 上 述 要求 的 E-R 图 ) 。 

关于 属性 名 、 实 体 名 及 其 实体 集 之 间 的 联系 名 ,应 尽 可 能 使 用 实际 专业 的 习惯 术语 ,但 
是 有 的 时 候 起 名 也 是 一 件 比 较 难 的 事情 ,例如 ,图 1-16 中 SD 表示 学 生 和 院 系 之 间 的 关系 ， 
实际 上 这 里 也 可 以 起 名 管理 关系 ,但 是 为 了 说 明 问 题 ,这 里 就 用 代号 表示 了 联系 名 。 


1.3.3 常用 (结构 ) 数 据 模型 


常用 的 结构 数据 模型 有 4 种 : 层次 模型 、 网 状 模型 .关系 模型 和 面向 对 象 模 型 。 

1. 层次 模型 

层次 模型 是 按照 树 状 (层次 ) 结 构 表示 实体 集 与 实体 集 之 间 的 联系 模型 。 层 次 模型 中 用 
记录 类 型 描述 表示 实体 集 , 每 个 节点 表示 一 个 记录 类 型 。 节 点 之 间 联 系 的 基本 方式 是 1 : n。 

层次 模型 满足 如 下 条 件 : 有 且 只 有 一 个 节点 没有 双亲 节点 ( 称 为 根 节点 ); 根 以 外 的 其 
他 节点 有 且 只 有 一 个 双亲 节点 。 如 图 1-17 所 示 为 一 个 层次 模型 的 例子 。 

学 院 

学 院 代号 | 学 院 名 


院 长 名 


系 办 公 室 
系 号 | 系 名 [ 系 主任 | | 办 公 室 号 [办公 室 名 | 办公室 主任 


教师 课程 
姓名 [年龄 | 职称 | [课程 号 | 课程 名 [学 时 


图 1-17 层次 模型 例子 


这 个 模型 表示 一 个 学 院 有 若干 个 系 和 行政 办 公 室 ,每 个 系 有 若干 名 教师 ,每 个 系 开设 若 
干 门 课程 。 院 和 系 之 间 、 院 和 办 公 室 之 间 、 系 和 教师 之 间 以 及 系 和 课程 之 间 都 是 一 对 多 联系 。 
图 1-18 给 出 的 就 是 这 个 层次 模型 的 一 个 具体 实例 。 


Dl ES Es 


! 
wi 


' 
080101 | 数据 库 


| Z| 4 ] 刷 必 及 


1-18 层次 模型 具体 实例 


层次 模型 的 特点 是 记录 之 间 的 联系 通过 指针 来 实现 ,常用 的 物理 实现 方法 有 邻接 法 和 
链接 法 。 邻 接 法 是 用 连续 的 物理 顺序 表示 记录 之 间 联 系 的 方法 ,在 该 方法 中 ,由 根 记录 开始 
存放 ,按照 自 项 向 下 、 自 左 至 右 的 顺序 存储 记录 。 链 接 法 是 一 种 采用 指针 实现 记录 间 联 系 的 


方法 , 它 用 指针 按 层次 顺序 把 各 记录 链接 起 来 ,而 各 记录 存储 时 不 一 定 按 层次 顺序 。 

层次 模型 和 文件 系统 的 数据 管理 方式 相 比 是 一 个 飞跃 ,用 户 和 设计 者 面 对 的 是 逻辑 数 
据 而 不 是 物理 数据 ,因此 ,用 户 不 必 花 费 大 量 的 精力 考虑 数据 的 物理 细节 。 

由 于 采用 指针 实现 记录 间 的 联系 ,所 以 ,层次 模型 具有 查询 效率 较 高 的 优点 。 同 时 层次 
模型 具有 结构 简单 、 层 次 分 明 ,便于 在 计算 机 内 实现 的 优点 。 在 层次 数据 结构 中 ,从 根 节点 
到 树 中 任意 节点 均 存 在 一 条 唯一 的 层次 路 径 ,为 有 效 地 进行 数据 操纵 也 提供 了 条 件 , 并 且 层 
次 数据 模型 提供 了 良好 的 完整 性 支持 。 

但 层次 模型 也 有 缺点 ,一 是 层次 数据 模型 缺乏 直接 表达 现实 世界 中 非 层 次 型 结构 的 复 
杂 联 系 , 如 多 对 多 的 联系 ,虽然 系统 有 多 种 辅助 手段 可 以 实现 多 对 多 的 联系 ,如 通过 引入 元 
余数 据 或 引入 虚拟 记录 的 方法 来 解决 ,但 是 用 户 不 易 掌 握 ; 二 是 层次 顺序 的 严格 限制 ,使 得 
对 插入 或 删除 操作 也 带 来 了 较 多 的 限制 ,并 且 查 询 子 女 节点 必须 通过 双亲 节点 ,所 以 使 得 应 
用 程序 的 编写 也 比较 复杂 。 

层次 模型 是 数据 库 中 使 用 得 较 早 的 一 种 数据 模型 ,IMS 是 IBM 公司 推出 的 最 有 影响 的 
一 种 典型 的 层次 模型 数据 管理 系统 ,也 是 一 个 曾经 被 广泛 使 用 的 数据 库 系统 。 

2. 网 状 模 型 

在 上 面 讲 过 ,层次 数据 模型 使 用 树 状 结构 可 以 有 效 地 描述 现实 世界 中 有 层次 联系 的 那 
些 事物 ,但 对 非 层 次 型 联系 要 用 树 状 结构 来 描述 它们 就 比较 困难 ,尽管 可 以 采用 某 种 转换 方 
法 把 它们 变换 成 等 价 的 层次 结构 ,但 由 于 将 使 用 大 量 的 指针 ,因此 会 使 系统 效率 下 降 。 为 了 
克服 层次 模型 结构 在 描述 非 层 次 型 联系 事物 时 的 局 限 ,1969 年 ,美国 CODASYL 委员 会 提 
出 了 DBTG 报告 。DBTG 报告 论述 了 网 状 数据 模型 和 网 状 数据 库 系 统 的 规范 ,成 为 网 状 数 
据 库 系统 的 典型 代表 。 它 对 于 网 状 数据 库 系 统 的 研究 和 发 展 产生 了 重要 影响 ,不 少 系统 采 
用 DBTG 模型 或 简化 的 DBTG 模型 ,如 Honeywell 公司 的 IDS/T 、HP 公司 的 Image/ 
3000,CINCOM 公司 的 TOTAL 等 。 

网 状 数据 模型 的 基本 特征 是 取消 了 层次 模型 的 限制 , 它 不 但 允许 一 个 以 上 的 节点 无 双 
亲 , 而 且 一 个 节点 允许 有 一 个 以 上 的 双亲 。 

在 网 状 数据 模型 中 ,用 有 向 图 结构 表示 实体 类 型 及 实体 间 的 i 有 
联系 ,有 向 图 中 每 个 节点 表示 一 个 实体 集 , 称 为 记录 型 ,用 和 矩形 框 ~ 

学 生 


表示 。 记 录 型 之 间 的 联系 是 通过 “ 系 ”(Set) 实 现 的 , 系 用 有 向 线段 > 


表示 ,箭头 指向 1 : n 联系 的 n 方 。1 方 的 记录 称 为 首 记 录 ,n 方 的 
记录 称 为 尾 记 录 。 图 1-19 是 网 状 结构 的 一 个 例子 。 

对 于 多 对 多 的 联系 ,在 网 状 模型 中 可 以 采用 两 个 一 对 多 联系 
实现 。 例 如 ,图 1-20(a) 表 示 了 学 生 记录 型 和 课程 记录 型 之 间 是 m : n 联系 ,通过 引入 联系 
记录 型 一 一 学 习 记 录 ,将 其 转换 为 两 个 1 :nn 联系 ,如 图 1-20(b) 所 示 。 

学 生 选 课 记 录 描 述 了 学 生 学 习 某 门 课程 的 成 绩 。S1 系 以 学 生 为 首 记 录 型 ,表示 学 生 所 
选修 的 课程 和 各 门 课 的 成 绩 。S2 系 以 课程 为 首 记 录 型 ,表示 某 门 课程 的 学 生成 绩 。 

图 1-21 给 出 的 是 这 个 网 状 模型 的 一 个 具体 实例 。 

网 状 数据 模型 是 一 种 比 层次 数据 模型 更 具 普遍 性 的 结构 ,反映 了 实体 集 间 普 遍 存 在 的 
更 为 复杂 的 联系 ,层次 结构 实际 上 是 网 状 结构 的 一 个 特例 。 

网 状 模 型 的 主要 优点 是 能 直接 描述 现实 世界 ,记录 之 间 的 联系 也 是 通过 指针 来 实现 的 ， 
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所 以 查询 效率 高 ; 缺点 是 结构 和 编程 复杂 , 难 掌 握 , 不 易 使 用 。 


3. 关系 模型 


关系 模型 是 最 重要 的 一 种 数据 模型 ,也 是 目前 主要 采用 的 数据 模型 。 它 是 1970 年 由 美 
国 IBM 公司 San Jose 研究 室 的 研究 员 E. F. Codd 提出 来 的 。 

关系 数据 模型 的 主要 特征 是 用 二 维 表格 表示 现实 世界 实体 集 及 实体 集 间 的 联系 。 在 数 
学 上 关系 有 严格 的 定义 , 它 与 前 两 种 模型 相 比 数据 结构 简单 ,容易 被 初学 者 理解 。 

自 20 世纪 80 年 代 以 来 ,新 推出 的 DBMS 几乎 都 支持 关系 数据 模型 , 非 关 系 系 统 的 产 
品 也 大 都 增加 了 与 关系 模型 的 接口 。 典 型 的 关系 DBMS 产品 有 Oracle、 Sybase、 SQL 


Server、.DB2、Access、VFP 等 。 
在 关系 数据 模型 中 把 二 维 表 称 为 关系 , 表 中 的 列 称 为 


属性 或 者 字段 , 列 中 的 值 取 自 相应 


的 域 (Domain) , 域 是 属性 所 有 可 能 取 值 的 集合 。 表 中 的 一 行 称 为 一 个 元 组 (Tuple) ,元 组 用 
关键 字 (Key Word) 标 识 。 对 二 维 表 框 架 的 描述 称 为 关系 模式 。 
例如 , 设 有 三 个 关系 学 生 、 课 程 、 学 习 表 ,分 别 描 述 了 三 个 不 同 的 实体 集 , 如 表 1-7 一 


表 1-9 所 示 。 
表 1-7 学 生 

学 号 姓 名 性 别 年 龄 学 院 
111801 张弛 男 20 计算 机 
111802 王 利 男 21 计算 机 
211801 李 红 女 19 机 电 
211802 赵 丹 女 20 机 电 

男 19 机 电 


211803 郭 皖 


表 1-8 课程 


课程 号 课 程 名 学 时 
080101 数据 库 原 理 64 
080102 操作 系统 70 

表 1-9 学 习 

学 号 课 程 号 成 ” 绩 
111801 080101 90 
111802 080101 68 
211801 080101 72 
211802 080101 85 
211803 080101 79 
111801 080102 76 
111802 080102 82 
211801 080102 93 


表 1-7 一 表 1-9 这 三 个 表 就 是 三 个 关系 ,每 一 个 关系 都 是 由 同一 种 记录 组 成 ,不 同 的 关 
系 可 以 有 相同 的 属性 , 它 表示 了 关系 间 的 联系 ,实体 集 间 的 联系 是 通过 在 二 维 表 中 存放 两 个 
实体 集 的 键 (关键 字 ) 实 现 的 。 例 如 , 表 1-7 和 表 1-8 之 间 是 多 对 多 的 联系 ,但 是 ,是 如 何 体 
现 的 呢 ? 在 这 里 ,学 生 和 学 习 之 间 有 一 个 公共 属性 一 一 学 号 ,课程 与 学 习 之 间 有 一 个 公共 属 
性 一 一 课程 号 ,所 以 学 习 关系 联系 了 学 生 和 课程 这 两 个 关系 ,并 且 在 学 习 表 中 可 以 多 次 出 现 
同一 个 学 号 ,表示 一 个 学 生 可 以 学 习 多 门 课程 ,同样 ,在 学 习 表 中 多 次 出 现 同一 个 课程 号 , 表 
示 一 门 课 程 可 以 被 多 个 学 生 学 习 , 所 以 ,学 生 和 课程 之 间 是 多 对 多 的 关系 ,在 这 里 是 通过 两 
个 一 对 多 的 关系 来 表示 的 。 

关系 数据 模型 的 描述 功能 表明 ,无 论 是 对 现实 世界 实体 集 的 描述 ,还 是 对 实体 集 之 间 联 
系 的 描述 ,都 可 以 采用 统一 的 数据 结构 一 一 二 维 表 。 这 种 数据 表示 的 一 致 性 给 关系 数据 库 
的 数据 定义 和 数据 操纵 带 来 了 极 大 的 方便 。 

作为 关系 ,具有 如 下 性 质 : 关系 中 的 每 一 个 属性 是 不 可 分 解 的 , 即 所 有 域 都 应 是 原子 数 
据 的 集合 ; 没有 完全 相同 的 行 和 列 ,行列 的 排列 顺序 是 无 关 紧 要 的 。 

在 关系 模型 中 有 一 个 比较 重要 的 概念 就 是 关系 模式 。 关 系 模式 是 关系 中 信息 内 容 结构 
的 描述 。 它 包括 关系 名 、 属 性 名 、 每 个 属性 列 的 取 值 集合 、 数 据 完整 性 约束 条 件 以 及 各 属性 
间 固 有 的 数据 依赖 关系 等 。 因 此 ,关系 模式 可 表示 为 : 

R(U,D.DOM.1,>) 


其 中 : 

R 是 关系 名 ; 

U 是 组 成 关系 R 的 全 部 属性 的 集合 

D 是 U 中 属性 取 值 的 值 域 ; 

DOM 是 属性 列 到 域 的 映射 , 即 DOM: U-~D, 且 每 个 属性 A; 所 有 可 能 的 取 值 集合 构成 
Di(i 二 1,2,…,n) ,并 允许 Di; 二 Dj ,i 关 j; 
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I 是 一 组 完整 性 约束 条 件 ; 

是 属性 集 间 的 一 组 数据 依赖 。 

通常 ,在 不 涉及 完整 性 约束 及 数据 依赖 的 情况 下 ,为 了 简化 ,可 用 R(U) 表 示 关 系 模式 。 
例如 ,学 生 关系 模式 可 表示 为 : 

S( 学 号 ,姓名 ,性 别 ,年 龄 ,学 院 ) 

在 层次 和 网 状 模型 中 ,联系 是 用 指针 来 实现 的 ,而 在 关系 模型 中 ,联系 是 通过 关系 模式 
中 的 关键 字 来 体现 的 。 

例如 ,要 查询 哪些 学 生 学 习 了 “操作 系统 "课程 ,系统 首先 在 课程 关系 中 查询 “操作 系统 ” 
的 课程 号 ,然后 在 学 习 关 系 中 查询 出 课程 号 与 “操作 系统 ”课程 号 的 值 相等 记录 的 学 生 学 号 ， 
最 后 再 在 学 生 关 系 中 找到 与 查询 的 学 号 相等 的 记录 。 在 这 三 个 关系 模式 中 ,关键 字 起 到 了 
导航 数据 的 作用 。 

在 关系 数据 库 中 ,对 数据 库 的 查询 和 更 新 操作 都 归结 为 对 关系 的 运算 。 即 以 一 个 或 多 
个 关系 为 运算 对 象 ,对 它们 进行 某 些 运算 形成 一 个 新 关系 ,提供 用 户 所 需 数据 。 关 系 运算 按 
其 表达 查询 方式 的 不 同 可 分 为 两 大 类 : 关系 代数 和 关系 演算 。 关 系 代数 是 由 一 组 以 关系 作 
为 运算 对 象 的 特定 的 关系 运算 所 组 成 ,用 户 通 过 这 组 运算 对 一 个 或 多 个 关系 进行 “组 合 ”与 
“分 割 ”, 从 而 得 到 所 需 的 新 关系 。 关 系 代数 运算 又 可 分 为 两 类 : 传统 的 集合 运算 和 专门 的 
关系 运算 。 传 统 的 集合 运算 包括 并 运算 、 差 运算 , 交 运 算 和 笛 卡 儿 乘积 运算 等 。 专 门 的 关系 
运算 是 根据 数据 库 操作 需要 而 定义 的 一 组 运算 ,包括 : 选择 运算 .投影 运算 .连接 运算 .自然 
连接 运算 、 半 连接 运算 、 自 然 半 连接 运算 和 除 运算 等 。 关 系 演算 是 以 数理 逻辑 中 的 谓词 演算 
来 表达 关系 的 操作 。 关 系 演算 根据 使 用 谓词 变量 类 型 的 不 同 ,可 分 为 元 组 关系 演算 和 域 关 
系 演算 两 种 。 关 系数 据 模型 中 的 关系 代数 和 关系 演算 ,为 关系 运算 提供 了 丰富 的 操作 功能 。 

关系 模型 的 数据 约束 通常 由 三 类 完整 性 约束 提供 支持 ,以 保证 对 关系 数据 库 进行 操作 
时 不 破坏 数据 的 一 致 性 。 

(1) 实体 完整 性 约束 。 实 体 完整 性 约束 是 指 任 一 关系 中 标识 属性 (关键 字 ) 的 值 ,不 能 
为 NULL, 和 否则 无 法 识别 关系 中 的 元 组 。 

(2) 参照 完整 性 约束 。 参 照 完整 性 是 不 同 关系 间 的 一 种 约束 , 当 存 在 关系 间 的 引用 时 ， 
要 求 不 能 引用 不 存在 的 元 组 。 若 属性 组 F 是 关系 RCU) 的 外 关键 字 ,并 是 关系 SCU) 的 关键 
字 ( 即 下 不 是 R(U) 的 关键 字 , 而 是 S(U) 的 关键 字 , 称 FF 是 R(U) 的 外 关键 字 ), 则 对 于 
R(U) 中 的 每 个 元 组 在 属性 组 F 上 的 值 必须 : 

@ 或 取 空 值 (NULL); 

@ 或 等 于 S(U) 中 某 个 元 组 的 关键 字 值 。 

对 于 取 空 值 表 示 该 值 没有 确定 ,对 于 非 空 值 则 必须 是 S 中 关键 字 存在 的 值 。 

(3) 用 户 定义 完整 性 约束 。 如 值 的 类 型 .宽度 等 。 

关系 模型 和 层次 模型 .网 状 模型 的 最 大 差别 是 用 关键 字 而 不 是 用 指针 导航 数据 , 除 此 之 
外 ,关系 模型 的 主要 优点 如 下 。 

(1) 关系 模型 有 坚实 的 理论 基础 。 在 层次 、 网 状 和 关系 三 种 常用 的 数据 模型 中 ,关系 模 
型 是 唯一 可 数学 化 的 数据 模型 。 关 系 的 数学 基础 是 关系 理论 ,对 二 维 表 进 行 的 数据 操作 相 
当 于 在 关系 理论 中 对 关系 进行 运算 。 因 此 ,在 关系 模型 中 .数据 模型 的 定义 与 操作 均 建 立 在 
严格 的 数学 理论 基础 上 ,这 为 关系 模型 的 研究 提供 了 有 力 的 支持 。 


(2) 二 维 表 不 仅 能 表示 实体 集 , 而 且 能 方便 地 表示 实体 集 间 的 联系 ,所 以 说 它 有 很 强 的 
表达 能 力 ,这 是 层次 模型 和 网 状 模型 所 不 及 的 。 例 如 ,学 生 和 课程 之 间 存 在 的 m : n 联系 ， 
在 层次 和 网 状 数据 模型 中 都 不 能 直接 描述 这 种 m : n 联系 ,但 在 关系 数据 模型 中 用 二 维 表 
就 可 以 直接 描述 这 种 m : n 联系 。 

(3) 简单 。 关 系 模型 的 基本 结构 是 二 维 表 , 数 据 的 表示 方法 统一 、 简 单 ,便于 在 计算 机 
中 实现 。 另 外 , 它 向 终端 用 户 提 供 的 是 简单 的 关系 模型 。 用 户 通 过 这 种 模型 表达 用 户 的 请 
求 , 而 不 涉及 系统 内 的 各 种 复杂 联系 。 所 以 关系 模型 具有 简单 .易学 易 用 的 优点 。 

(4) 数据 独立 性 高 。 关 系 模型 中 去 掉 了 用 户 接 口中 有 关 存 储 结构 和 存 取 方 法 的 描述 ， 
即 关 系数 据 模型 的 存 取 路 径 对 用 户 透 明 ,数据 库 中 数据 的 存 取 方法 具有 按 内 容 定 址 的 性 质 ， 
故 有 较 高 的 数据 独立 性 。 这 为 关系 数据 库 的 建立 ,扩充 ,调整 和 重 构 提供 了 方便 。 

尽管 关系 模型 有 很 多 优点 ,但 也 有 不 足 之 处 ,主要 缺点 是 查询 效率 常常 不 如 非 关系 数据 
模型 ,这 是 由 于 存 取 路 径 对 用 户 透 明 ,查询 优化 处 理 依靠 系统 完成 ,加 重 了 系统 的 负担 。 

目前 ,关系 数据 模型 是 商品 化 DBMS 的 主流 数据 模型 ,并 且 在 今后 相当 长 的 时 间 内 ,对 
于 大 量 事务 处 理 的 应 用 中 仍 将 被 继续 使 用 。 

4. 面向 对 象 数 据 模型 

虽然 关系 模型 比 层 次 模型 .网 状 模型 简单 灵活 ,但 还 不 能 表达 现实 世界 中 的 许多 复杂 的 
数据 结构 。 例 如 ,计算 机 辅助 设计 中 的 图 形 数据 、 多 媒体 应 用 中 的 声音 、 图 像 等 ,它们 需要 更 
高 级 的 数据 库 技术 来 表达 ,为 了 能 够 处 理 这 样 的 数据 ,就 产生 了 面向 对 象 数 据 模型 。 面 向 对 
象 概念 最 早出 现在 1968 年 的 Smalltalk 语言 中 ,然后 迅速 渗透 到 计算 机 领域 的 每 一 个 分 支 ， 
目前 已 经 在 数据 库 技术 中 应 用 。 

面向 对 象 数据 模型 (Object-Oriented Data Model, OO 数据 模型 ) 是 面向 对 象 程序 设计 
方法 与 数据 库 技术 相 结 合 的 产物 。 它 的 基本 目标 是 以 更 接近 人 类 思维 的 方式 描述 客观 世界 
的 事物 及 其 联系 , 且 使 描述 问题 的 问题 空间 和 解决 问题 的 方法 空间 在 结构 上 尽 可 能 一 致 , 以 
便 对 客观 实体 进行 结构 模拟 和 行为 模拟 。 

在 面向 对 象 数 据 模型 中 ,可 以 将 现实 世界 中 的 一 切 事物 看 作对 象 ,一 个 对 象 不 仅 包括 描 
述 它 的 数据 ,还 包括 对 它 进行 操作 方法 的 定义 。 也 可 以 把 面向 对 象 数据 模型 看 作 一 种 可 扩 
充 的 数据 模型 ,这 种 数据 模型 比 传统 数据 模型 有 更 丰富 的 语义 ,用户 根据 应 用 需要 可 以 定义 
新 的 数据 类 型 及 相应 的 约束 和 操作 。 因 此 ,面向 对 象 数 据 模型 自 提出 后 ,受到 人 们 的 广泛 关 
注 , 并 且 给 予 了 足够 的 重视 ,使 其 逐步 完善 日趋 成 熟 。 

在 面向 对 象 数据 模型 中 最 基本 的 概念 是 对 象 和 类 。 

1) 对 象 

在 面向 对 象 数据 模型 中 ,将 所 有 现实 世界 的 任 一 实体 都 模拟 为 一 个 对 象 ,对 象 是 客观 存 
在 并 能 互相 区 别 的 , 它 是 客观 世界 中 概念 化 的 基本 实体 .因此 实体 都 可 以 视 为 对 象 。 复 杂 对 
象 可 以 由 相对 简单 的 对 象 以 某 种 方法 组 合 而 成 ,所 以 世界 上 所 有 事物 都 是 由 各 种 “对 象 " 组 
成 的 。 例 如 ,一 个 整数 一 个 字符 串 是 一 个 对 象 ,一 部 电影 一 个 公司 一 辆 坦克 也 是 一 个 对 
象 。 从 动态 角度 看 ,对 象 及 其 操作 就 是 对 象 的 行为 。 因 此 ,一 个 对 象 是 对 一 组 信息 及 对 其 操 
作 的 描述 。 

对 象 与 记录 的 概念 相似 ,但 比 记录 更 为 复杂 。 一 个 对 象 包含 若干 属性 ,用 来 描述 对 象 的 
状态 、 组 成 和 特性 ,在 面向 对 象 数 据 模型 中 允许 属性 也 是 对 象 , 它 可 以 包含 其 他 对 象 作 为 其 
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属性 ,如 此 下 去 ,从 而 使 得 对 象 变 得 十 分 复杂 。 

除了 属性 外 ,对 象 还 包含 若干 方法 ,用 以 描述 对 象 的 行为 特性 。 方 法 的 定义 与 表示 包括 
两 部 分 ,一 是 方法 的 接口 ,给 出 了 方法 的 外 部 表示 、 包 含 的 名 称 .参数 及 结果 类 型 ; 二 是 方法 
的 实现 , 它 是 用 程序 设计 语言 编写 的 一 段 可 对 对 象 进行 某 种 操作 的 程序 ,用 以 实现 方法 的 功 
能 ,因此 方法 也 称 操作 , 它 可 以 改变 对 象 的 状态 。 

在 面向 对 象 数据 模型 中 ,系统 把 一 个 对 象 的 属性 和 方法 封装 为 一 个 整体 ,用 户 只 能 见 到 
对 象 封装 界面 上 的 信息 ,对 象 内 部 对 用 户 是 隐蔽 的 。 封 装 的 目的 是 为 了 使 对 象 的 使 用 和 实 
现 分 开 , 用 户 不 必 了 解 内 部 操作 实现 的 细节 ,只 需 用 发 送 消息 的 方法 实现 对 对 象 的 访问 。 这 
样 ,从 程序 设计 来 看 ,对 象 是 一 个 程序 模块 ; 从 用 户 角度 来 看 ,对 象 为 他 们 提供 了 所 期 望 的 
行为 。 这 种 使 数据 和 操作 封装 在 一 起 的 建 模 方法 ,有 利于 程序 的 模块 化 ,可 以 提高 系统 的 可 
维护 性 和 易 修改 性 。 

为 了 实现 对 象 与 对 象 之 间 的 联系 ,对 象 之 间 就 要 进行 通信 ,通信 的 构造 称 为 消息 。 消 息 
是 用 来 请 求 对 象 执行 某 一 操作 或 回答 某 些 信息 的 要 求 。 当 一 个 消息 发 送 给 某 个 对 象 时 , 消 
息 中 包含 要 求 接收 对 象 去 执行 某 些 活动 的 信息 ,接收 到 消息 的 对 象 经 过 解释 进行 相应 的 操 
作 , 并 以 消息 的 形式 返回 操作 结果 。 消 息 一 般 由 三 部 分 组 成 : 接收 者 一 一 消息 所 施加 作用 
的 对 象 ; 操作 者 一 一 给 出 消息 的 操作 要 求 ; 操作 参数 一 一 消息 操作 时 所 需要 的 外 部 数据 。 

2) 类 和 类 的 实例 

数据 库 中 一 般 包 含 大 量 的 对 象 ,可 以 将 类 似 的 对 象 归并 为 类 , 即 类 是 具有 共同 属性 和 方 
法 的 对 象 的 集合 ,这 些 属 性 和 方法 可 以 在 类 中 统一 说 明 ,而 不 必 在 类 的 每 个 实例 中 重复 
说 明 。 

类 中 每 个 对 象 称 为 该 类 的 一 个 实例 ,同一 类 中 对 象 的 属性 名 虽然 是 相同 的 ,但 这 些 属性 
的 取 值 会 因 各 个 实例 而 异 ,因此 ,类 的 属性 实际 上 是 个 变量 。 在 特殊 情况 下 ,有 些 变量 的 值 
在 一 个 类 中 是 一 样 的 ,这 些 变量 称 为 类 常量 。 例 如 ,有 些 属 性 规定 有 默认 值 , 当 在 实例 中 没 
有 给 出 该 属性 值 时 ,就 取 其 默认 值 。 这 些 默认 值 在 一 个 类 中 是 公用 的 ,因而 可 看 成 类 常量 。 

在 面向 对 象 数据 模型 中 ,类 被 组 织 成 一 个 有 根 的 有 向 无 环 图 , 称 为 类 层次 结构 。 在 类 层 
类 :学生 ”次 结构 中 ,一 个 类 的 下 层 可 以 有 多 个 子 类 ; 一 个 类 的 上 层 
学 号 也 可 以 有 多 个 超 类 。 图 1-22 是 一 个 类 层次 结构 的 例子 。 
姓名 由 图 1-22 可 知 ,模型 中 有 5 个 类 ,分 别 是 学 习 、 授 课 、 
SS @— | 
6 全 别 | 学 生 、 课 程 和 教师 。 其 中 ,学 习 类 的 属性 SS 取 值 为 学 生 类 
AL 弄 娄 | 中 的 对 象 ( 即 “ 诬 套 ”) ,属性 CC 取 值 为 课程 类 中 的 对 象 , 授 
类 : 识 程 ” 课 类 的 属性 CC 取 值 为 课程 类 中 的 对 象 属性 ,TT 取 值 为 
音程 了 | 教师 类 中 的 对 象 。 
课程 名 称 


课时 


从 上 述 分 析 可 以 看 出 ,面向 对 象 数据 模型 具有 封装 
性 ,信息 隐匿 性 ,同时 还 具有 持久 性 、 继 承 性 、 代 码 共享 和 
类 教师 软件 重用 性 等 特性 。 其 中 ,持久 性 指 对 象 的 生存 期 超过 所 
编号 | 属 程序 的 执行 期 , 即 当 一 个 程序 在 执行 过 程 中 产生 了 一 个 
授课 班级 姓名 | 持久 性 的 对 象 ,而 在 此 程序 执行 结束 后 , 若 再 重新 执行 该 
至 冤 | 程序 时 ,此 对 象 依然 存在 。 继 承 性 是 指 超 类 、 子 类 以 及 对 
图 1-22 类 层次 结构 的 例子 。 象 间 的 继承 性 ,继承 性 避免 了 一 些 宛 余 信息 ,一 个 子 类 继 


承 其 超 类 的 所 有 性 质 , 且 这 种 继承 具有 传递 性 。 因 此 ,属于 某 个 类 的 对 象 除 具 有 该 类 所 定义 
的 特性 外 ,还 自动 地 具有 其 超 类 的 全 部 特性 。 子 类 除 继承 超 类 中 的 属性 和 方法 外 ,还 可 以 在 
子 类 中 定义 该 子 类 特殊 的 属性 和 方法 。 

除 此 之 外 ,面向 对 象 模型 最 大 的 一 个 特点 是 有 丰富 的 语义 便于 更 自然 地 描述 现实 世界 。 

目前 ,面向 对 象 数据 模型 已 被 用 作 某 些 DBMS 的 数据 模型 。 甚 至 有 人 预言 ,数据 库 的 
未 来 将 是 面向 对 象 的 时 代 , 原 因 是 面向 对 象 数 据 模型 能 完整 地 、 自 然 地 描述 现实 世界 的 数据 
结构 ,具有 丰富 的 表达 能 力 。 但 是 ,面向 对 象 数据 库 还 只 是 一 种 新 兴 的 技术 , 它 的 发 展 远 不 
如 关系 数据 库 成 熟 , 数 据 模型 相对 比较 复杂 ,并 且 不 是 建立 在 完美 的 数学 基础 之 上 ,涉及 的 
知识 比较 多 ,系统 实现 的 难度 较 大 ,也 不 像 关系 数据 库 那样 有 一 个 统一 的 标准 ,因此 ,目前 还 
没有 达到 关系 数据 库 的 普及 程度 ,所 以 ,目前 比较 适合 作为 数据 库 概 念 设 计 的 数据 模型 。 但 
可 以 肯定 ,面向 对 象 数据 库 是 一 项 具有 重大 理论 意义 和 应 用 前 景 的 数据 库 技 术 。 

上 述 4 种 结构 数据 模型 的 比较 见 表 1-10。 


表 1-10 4 种 结构 数据 模型 比较 表 


层次 模型 网 状 模型 关系 模型 面向 对 象 模型 
开始 情况 es ODA re a 1970 年 E. F.Codd 20 世纪 80 年 代 
数据 结构 | 复杂 ( 树 结构 ) 复杂 (有 向 图 ) 简单 (二 维 表 ) 复杂 ( 岩 套 递归 ) 
数据 联系 | 通过 指针 通过 指针 表 间 的 公共 | 通过 对 象 标识 
查询 语言 | 过 程 性 语言 过 程 性 语言 非 过 程 性 语言 面向 对 象 语言 
oar ls ee oes 
盛行 期 间 | 20 世 纪 70 年 代 | 2 ee 年 代 至 | 20 世纪 80 年 代 至 今 | 20 世纪 90 年 代 至 今 


1.4 数据 库 系 统 结构 


在 前 面 已 经 对 数据 库 系 统 的 定义 进行 了 介绍 ,本 节 主 要 讨论 数据 库 系统 的 体系 结构 。 
对 于 数据 库 系统 的 体系 结构 可 以 从 不 同 的 角度 进行 考察 。 从 数据 库 应 用 开发 人 员 和 角度 看 ， 
数据 库 系 统 通常 采用 三 级 模式 结构 ; 从 数据 库 最 终 用 户 角度 看 ,数据 库 系统 结构 可 分 为 集 
中 式 数据 库 结构 、 网 络 环境 下 的 客户 机 /服务 器 结构 、 分 布 式 数据 库 系 统 结构 以 及 并 行 数据 
库 系统 结构 等 。 本 节 重 点 讨论 数据 库 系统 的 三 级 模式 结构 ,也 可 以 称 为 数据 库 系统 内 部 
结构 。 


1.4.1 数据 库 系统 的 三 级 模式 结构 


一 个 数据 库 结构 从 逻辑 上 可 以 划分 为 三 个 层次 : 外 部 模式 (External Schema) ,概念 模 第 
式 (Conceptual Schema) 和 内 部 模式 (Internal Schema) , 称 为 数据 库 系统 的 三 级 模式 结构 。 | 章 
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这 个 结构 最 早 是 在 1971 年 通过 的 DBTG 报告 中 提出 来 的 ,后 来 收录 在 1975 年 的 ANSI/ 
X3/SPARC( 美 国 国家 标准 化 组 织 / 授 权 的 标准 委员 会 /系统 规划 与 需求 委员 会 ) 联 合成 立 的 
DBMS 研究 组 的 中 期 报告 中 。 虽 然 目前 DBMS 产品 非常 多 ,并 且 多 种 多 样 , 但 大 多 数 系统 
在 体系 结构 上 都 具有 三 级 结构 的 特征 ,如 图 1-23 所 示 。 


用 户 1 | | 用 户 1 用 户 2，| | 用 户 2 用 户 N | | 用 户 Ns 


| | | 


外 模式 1 外 模式 2 外 模式 V | 


----------- -一 一 ---] 外 模式 /概念 模式 映像 
概念 模式 


-------------------- 1- ---------- 十 概念 模式 内 模式 吹 像 


图 1-23 ”数据库 系 统 三 级 模式 结构 


如 图 1-23 所 示 的 三 级 模式 结构 的 目的 是 将 用 户 应 用 与 物理 数据 库 分 离 。 

在 了 解 三 级 模式 概念 之 前 ,下 面 首 先 再 次 明确 “型 与“ 值 ? 的 概念 。 

型 (Type) : 对 某 一 类 数据 的 结构 和 属性 的 说 明 。 

值 (Value): 是 型 的 一 个 具体 赋值 。 

例如 ,教师 记录 : 

记录 型 : (教师 编号 ,姓名 ,性 别 , 学 院 ,年 龄 ,籍贯 ) 。 

该 记录 型 的 一 个 记录 值 : (0801108 , 郑 小 红 , 女 ,计算 机 ,54, 福 建 ) 。 

1. 概念 模式 

概念 模式 简称 模式 ,是 由 数据 库 设计 者 综合 所 有 用 户 数 据 , 按 照 统 一 的 观点 构造 的 对 数 
据 库 全 局 逻辑 结构 的 描述 。 概 念 模式 就 是 型 的 描述 ,反映 的 是 数据 的 结构 及 其 联系 ,模式 是 
相对 稳定 的 。 模 式 的 一 个 具体 值 称 为 模式 的 一 个 实例 (Instance) ,反映 数据 库 某 一 时 刻 的 
状态 ,同一 个 模式 可 以 有 很 多 实例 ,实例 随 数据 库 中 的 数据 的 更 新 而 变动 。 

一 个 数据 库 只 有 一 个 概念 模式 , 它 是 数据 库 系统 三 级 模式 结构 的 中 间 层 , 既 不 涉及 数据 
的 物理 存储 细节 和 硬件 环境 ,也 与 具体 的 应 用 程序 及 程序 设计 语言 无 关 。 

概念 模式 由 DBMS 提供 的 模式 描述 语言 (模式 DDL) 来 定义 和 描述 。 

2. 外 部 模式 

外 部 模式 又 称 子 模式 , 介 于 模式 与 应 用 之 间 , 是 用 户 与 数据 库 之 间 的 接口 ,是 数据 库 用 
户 ( 包 括 应 用 程序 员 和 最 终 用 户 ) 能 够 看 见 和 使 用 的 局 部 数据 的 逻辑 结构 和 特征 的 描述 。 

从 逻辑 关系 来 看 ,外 部 模式 是 概念 模式 的 一 部 分 ,或 者 说 外 部 模式 是 概念 模式 的 一 个 逻 
辑 子 集 。 一 个 数据 库 可 以 有 多 个 外 部 模式 。 外 部 模式 表示 了 用 户 所 理解 的 实体 、 实 体 属性 
和 实体 间 的 联系 。 所 以 说 ,模式 与 外 模式 的 关系 是 一 对 多 的 关系 。 

对 模式 中 的 同一 数据 ,在 外 部 模式 中 的 结构 类型. 长度 .保密 级 别 等 都 可 以 不 同 ,同一 


外 部 模式 也 可 以 为 某 一 用 户 的 多 个 应 用 系统 所 使 用 ,但 一 个 应 用 程序 只 能 使 用 一 个 外 部 模 
式 , 外 部 模式 与 应 用 的 关系 也 是 一 对 多 的 关系 。 

外 部 模式 由 DBMS 提供 的 外 部 模式 描述 语言 (外 部 模式 DDL) 来 定义 和 描述 。 

设置 外 部 模式 不 仅 可 以 使 用 户 对 数据 库 操作 方便 ,而 且 有 利于 数据 共享 , 即 从 同一 概念 
模式 中 产生 若干 个 外 部 模式 供 若干 个 用 户 使 用 ,这 不 仅 实现 了 数据 共享 ,还 减少 了 数据 元 
余 , 减 少 了 数据 潜在 不 一 臻 性。 并且 由 于 外 部 模式 和 概念 模式 之 间 的 映射 关系 保证 了 数据 
的 独立 性 ,同时 由 于 用 户 只 能 使 用 在 给 定 的 外 部 模式 定义 范围 内 的 数据 ,这 就 将 数据 库 中 其 
他 数据 隔离 开 , 因 而 一 方面 缩小 了 由 于 应 用 程序 的 错误 或 人 为 操作 错误 的 传播 范围 ,确保 了 
其 他 数据 的 安全 , 另 一 方面 有 利于 数据 的 保密 , 故 安全 保密 性 好 。 

3. 内 部 模式 

内 部 模式 也 称 存储 模式 ,是 对 数据 库 中 数据 物理 结构 和 存储 方式 的 描述 ,是 数据 在 数据 
库 内 部 的 表示 方式 。 

一 个 数据 库 只 有 一 个 内 部 模式 。 在 内 部 模式 中 规定 了 所 有 内 部 记录 类 型 .索引 和 文件 
的 组 织 方式 ,以 及 数据 控制 方面 的 细节 。 

因此 ,内 部 模式 是 DBMS 管理 的 最 低层 , 它 是 物理 存储 设备 上 存储 数据 时 的 物理 抽象 。 
内 部 模式 由 DBMS 提供 的 内 部 模式 描述 语言 (内 部 模式 DDL) 来 定义 和 描述 。 

数据 库 的 三 级 模式 结构 的 名 称 在 不 同 的 系统 中 有 些 差异 , 表 1-11 列 出 了 几 个 关于 模式 
的 对 照 表 。 

表 1-11 数据 抽象 术语 
系统 名 称 


观察 角度 DBTG 报告 中 ANSI/X3/SPARC SYSTEM R 
物理 观点 物理 模式 内 部 模式 存储 文件 
全 局 逻辑 观点 模式 概念 模式 基 表 集 
应 用 程序 观点 子 模 式 外 部 模式 视图 


通常 把 三 级 模式 分 别 简 称 为 : 内 模式 ,模式 、 外 模式 。 
需要 注意 的 是 ,这 三 层 模 式 仅仅 是 对 数据 的 描述 ,而 数据 实际 上 只 存在 于 物理 层 。 


1.4.2 数据 库 的 两 级 映像 与 数据 独立 性 


数据 库 系统 的 三 级 模式 是 对 数据 进行 三 个 级 别 的 抽象 。 它 把 数据 的 具体 组 织 留 给 
DBMS 去 做 ,用 户 只 要 抽象 地 处 理 数据 ,而 不 必 关 心 数据 在 机 器 中 的 具体 表示 方式 和 存储 
方式 。 为 了 实现 这 三 个 抽象 级 别 的 联系 和 转换 , 即 提高 数据 库 系 统 中 的 数据 独立 性 ,DBMS 
在 这 三 级 模式 间 提供 了 两 层 映像 : 外 模式 /模式 映像 和 模式 /内 模式 映像 。 所 谓 映 像 是 一 种 
对 应 规则 , 它 指出 了 映像 双方 是 如 何 进行 转换 的 。 数 据 库 的 三 级 结构 是 依靠 映像 来 联系 和 
互相 转换 的 。 正 是 这 两 层 映像 保证 了 数据 库 系统 中 的 数据 具有 较 高 的 数据 独立 性 。 

数据 独立 性 是 指 应 用 程序 和 数据 结构 之 间 相 互 独立 ,不 受 影响 。 在 三 层 模式 体系 结构 
中 数据 独立 性 可 定义 为 : 数据 库 系 统 在 某 一 层次 模式 上 的 改变 不 会 使 它 的 上 一 层 模式 也 发 
生 改 变 的 能 力 。 数 据 独立 性 包括 数据 逻辑 独立 性 和 数据 物理 独立 性 。 人 逻辑 独立 性 表示 一 旦 
模式 发 生变 化 ,无 须 改 变 外 模式 或 应 用 程序 的 能 力 。 物 理 独立 性 表示 不 会 因为 内 模式 发 生 
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改变 而 导致 概念 模式 发 生 改变 的 能 力 。 

1. 外 模式 /模式 映像 

外 模式 /模式 映像 定义 了 各 个 外 模式 与 模式 间 的 映像 关系 。 对 应 于 同一 个 模式 可 以 有 
多 个 外 模式 ,对 于 每 一 个 外 模式 ,数据库 系统 都 有 一 个 外 模式 /模式 映像 , 它 定义 了 该 外 模式 
与 模式 之 间 的 对 应 关系 。 这 些 映 像 定 义 通常 在 各 自 的 外 模式 中 加 以 描述 。 

如 果 数 据 库 的 模式 需要 改变 时 ,例如 ,增加 记录 类 型 .增加 数据 项 、 增 加 新 的 关系 或 属 
性 ,改变 属性 的 数据 类 型 改变 数据 间 的 联系 等 ,只 要 对 外 模式 /模式 映像 做 相应 的 修改 ,可 
以 使 外 模式 和 应 用 程序 尽 可 能 保持 不 变 , 保 证 了 数据 与 程序 的 逻辑 独立 性 。 这 种 用 户 数 据 
独立 于 全 局 逻辑 数据 的 特性 称 为 数据 逻辑 独立 性 。 

2. 模式 /内 模式 映像 

模式 /内 模式 映像 定义 了 数据 库 全 局 逻辑 结构 与 存储 结构 之 间 的 对 应 关系 。 如 果 数 据 
库 为 了 某 种 需要 改变 内 模式 ,例如 ,为 了 提高 对 某 个 文件 的 存 取 效率 ,选用 了 另 一 种 存储 结 
构 时 ,可 对 模式 /内 模式 映像 做 相应 改变 ,可 以 使 模式 尽 可 能 保持 不 变 , 从 而 不 必修 改 或 重 写 
应 用 程序 ,保证 了 数据 与 程序 的 物理 独立 性 。 这 种 全 局 数据 逻辑 独立 于 物理 数据 的 特性 称 
为 数据 物理 独立 性 。 

由 于 数据 库 系统 具有 数据 独立 性 ,因而 数据 库 系 统 把 用 户 数 据 与 物理 数据 完全 分 开 , 使 
用 户 摆脱 了 烦琐 的 物理 存储 细节 ,减少 了 应 用 程序 维护 的 开销 。 但 需要 说 明 的 是 ,目前 流行 
的 一 些 数据 库 系 统 的 独立 性 尚未 达到 理想 要 求 , 特 别 是 数据 逻辑 独立 性 难于 彻底 实现 。 例 
如 ,在 模式 中 删除 某 应 用 程序 所 需要 的 记录 型 ,或 记录 型 中 的 某 个 数据 项 ,或 改变 记录 型 之 
间 的 联系 等 ,都 会 引起 该 应 用 程序 对 应 的 子 模式 发 生变 化 ,从 而 导致 该 应 用 程序 的 修改 。 

数据 库 系 统 的 三 级 模式 结构 定义 了 数据 库 的 三 个 抽象 层次 : 物理 数据 库 、 概 念 数据 库 
和 录 辑 数据 库 。 数 据 库 系统 的 三 种 不 同 模 式 只 是 提供 处 理 数 据 的 框架 ,而 填 人 这 些 框架 中 
的 数据 才 是 数据 库 的 内 容 。 根 据 三 级 模式 结构 引出 的 数据 库 抽 象 层 次 ,是 从 不 同 角 度 观察 
数据 库 的 视图 。 图 1-24 给 出 了 数据 库 的 分 级 结构 与 抽象 层次 的 对 应 关系 。 

以 外 模式 为 框架 的 数据 库 称 为 逻辑 数据 库 。 它 是 数据 库 结 构 的 最 外 一 层 ,是 用 户 所 看 
到 和 使 用 的 数据 库 , 因 而 也 称 为 用 户 数 据 库 或 用 户 视图 。 所 以 逻辑 数据 库 是 某 个 或 某 些 用 
户 使 用 的 数据 集合 , 即 用 户 看 到 和 使 用 的 那 部 分 数据 的 逻辑 结构 ( 称 为 局 部 逻辑 结构 )。 用 
户 根据 系统 提供 的 外 模式 用 查询 语言 或 应 用 程序 对 数据 库 的 数据 进行 所 需 的 操作 。 

以 模式 为 框架 的 数据 库 称 为 概念 数据 库 。 它 是 数据 库 结 构 中 的 一 个 中 间 层 次 ,是 数据 
库 的 整体 逻辑 表示 , 它 描述 了 每 一 个 数据 的 逻辑 定义 及 数据 间 的 逻辑 联系 。 为 了 减少 数据 
宛 余 ,把 所 有 用 户 的 数据 进行 综合 ,构成 统一 的 有 机 逻辑 整体 。 概 念 数据 库 描 述 了 数据 库 系 
统 所 有 对 象 的 逻辑 关系 ,而 不 涉及 它们 的 物理 存储 情况 。 因 此 ,概念 数据 库 本 身 并 不 是 一 个 
实际 存在 的 数据 库 , 而 是 实际 存在 的 物理 数据 库 的 一 种 逻辑 描述 , 它 是 数据 库 管 理 员 
CDBA) 概 念 下 的 数据 库 ,或 称 数据 库 管理 员 的 视图 。 

以 内 模式 为 框架 的 数据 库 称 为 物理 数据 库 。 它 是 数据 库 中 最 里 面 的 一 个 层次 ,是 物理 
存储 设备 上 实际 存储 着 的 数据 集合 。 这 些 数据 称 为 原始 数据 ,是 用 户 处 理 的 对 象 。 从 系统 
程序 员 看 ,这 些 数据 是 他 们 用 文件 方式 组 织 的 一 个 个 物理 文件 (存储 文件 )。 系 统 程序 员 编 
制 专门 的 存 取 程序 ,实现 对 文件 中 数据 的 存 取 。 因 此 ,物理 数据 库 也 称 为 系统 程序 员 视 图 ， 
或 称 数据 的 存储 结构 。 
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1-24 数据库 的 分 级 结构 与 抽象 层次 的 对 应 关系 
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图 1-25 用 户 访 问 数据 库 的 过 程 


总 之 ,对 一 个 数据 库 系统 而 言 , 实 际 上 存在 的 只 是 物理 数据 库 , 它 是 数据 访问 的 基础 。 
概念 数据 库 是 物理 数据 库 的 抽象 表示 ,用 户 数据 库 是 概念 数据 库 的 部 分 抽取 ,是 用 户 与 数据 
库 的 接口 。 用 户 根据 外 模式 进行 操作 ,通过 外 部 模式 /概念 模式 的 映像 与 概念 数据 库 联 系 起 
来 ,再 通过 概念 模式 /内 部 模式 的 映像 与 物理 数据 库 联系 起 来 。DBMS 的 核心 工作 之 一 就 
是 完成 三 个 层次 数据 库 之 间 的 转换 ,把 用 户 对 数据 库 的 操作 转换 成 对 物 到 


数据 库 的 操作 。 


数据 库 管 理 系统 实现 映像 的 能 力 , 将 直接 影响 该 数据 库 系统 能 够 达到 的 数据 独立 性 的 程度 。 
1.4.3 用 户 通过 DBMS 访问 数据 库 的 过 程 


数据 库 管 理 系 统 是 一 个 负责 数据 库 的 定义 、 建 立 、 操 作 、 管 理 和 维护 的 软件 系统 。 它 是 
数据 库 系统 的 核心 组 成 部 分 ,也 是 用 户 的 应 用 程序 和 物理 数据 库 之 间 的 桥梁 。 用 户 ,程序 
员 、DBA 对 数据 库 数据 的 一 切 操作 ,包括 定义 、 查 询 、 更 新 及 各 种 控制 ,都 是 通过 数据 库 管理 
系统 进行 的 。DBMS 的 工作 示意 图 如 图 1-25 所 示 。 
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DBMS 的 工作 过 程 如 下 。 

(1) 接受 应 用 程序 的 数据 请 求 。 

(2) DBMS 对 用 户 的 操作 请 求 进行 分 析 (DBMS 类 似 于 一 个 操作 命令 解释 器 ,把 用 户 程 
序 的 数据 操作 语句 转换 为 具体 的 物理 数据 处 理 , 它 又 像 一 个 向 导 ,把 用 户 对 数据 库 的 一 次 访 
问 从 用 户 数据 库 带 到 概念 数据 库 ,再 导向 物理 数据 库 , 从 而 有 效 地 实现 了 数据 库 三 级 模式 间 
的 转换 ) 。 

(3) 由 于 在 计算 机 的 存储 设备 上 的 数据 数据 库 管 理 系 统 不 能 直接 操作 ,必须 由 操作 系 
统统 一 管理 调度 ,所 以 ,数据 库 管理 系统 要 向 操作 系统 发 出 操作 请 求 。 

(4) 操作 系统 接 到 命令 后 ,对 数据 库 中 的 数据 进行 处 理 ,将 结果 送 到 系统 缓冲 区 ,并 发 
出 读 完 标志 。 

(5) DBMS 接 到 回答 信号 后 ,将 缓冲 区 的 数据 经 过 模式 映射 , 变 成 用 户 的 逻辑 记录 送 到 
用 户 工作 区 ,同时 给 用 户 回 答 成 功 与 否 的 信息 。 

上 述 操作 过 程 也 可 以 用 图 1-26 表示 。 


物理 数据 库 


数据 请 求 
"| DBMS 
(处 理 结果 ) | 操作 系统 (OS) 


| 用 户 /应 用 程序 


低层 命令 


数据 
(查询 结果 ) 
图 1-26 DBMS 的 工作 模式 


通过 图 1-24 和 图 1-25 可 以 看 出 ,DBMS 在 数据 库 系统 中 的 地 位 ,同时 也 可 以 看 出 
DBMS 和 操作 系统 之 间 的 关系 。 

DBMS 除了 具有 处 理 数据 库 中 的 数据 之 外 ,还 有 一 个 特殊 的 数据 库 , 称 为 数据 字典 。 
数据 字典 (Data Dictionary,DD) 是 描述 各 级 模式 的 信息 ,主要 包括 所 有 数据 的 结构 名 、 意 
义 、 描 述 定义 .存储 格式 、 完 整 性 约束 、 使 用 权限 等 信息 。 关 系数 据 库 的 数据 字典 主要 包括 对 
基 表 ,视图 的 定义 以 及 存 取 路 径 ( 索 引 、 散 列 等 ) ,访问 权限 和 用 于 查询 优化 的 统计 数据 等 的 
描述 。 由 于 数据 字典 包含 数据 库 系统 中 的 大 量 描述 信息 (而 不 是 用 户 数据 ), 因 此 也 称 它 为 
“描述 信息 库 ”。 在 结构 上 ,数据 字典 也 是 一 个 数据 库 ,为 了 区 分 物理 数据 库 中 的 数据 和 数据 
字典 中 的 数据 ,通常 称 数据 字典 中 的 数据 为 元 数据 (Meta-Data) ,组 成 数据 字典 文件 的 属性 
称 为 元 属性 。 数 据 字 典 是 DBMS 存 取 和 管理 数据 的 基本 依据 ,主要 由 系统 管理 和 使 用 。 


1.5 数据库 管理 系统 


从 前 面 关于 数据 库 系 统 的 组 成 和 系统 结构 来 看 ,数据库 管 理 系统 是 数据 库 系统 的 核心 。 
它 的 主要 功能 是 建立 和 维护 数据 库 ,接收 和 完成 用 户 访问 数据 库 的 各 种 请 求 ,是 一 种 操纵 和 
管理 数据 库 的 大 型 软件 。 它 对 数据 库 进行 统一 的 管理 和 控制 ,用 户 通 过 它 访问 数据 库 中 的 
数据 ,数据 库 管理 员 也 通过 它 进行 数据 库 的 维护 工作 。 它 提供 多 种 功能 ,可 使 多 个 应 用 程序 
和 用 户 用 不 同 的 方法 在 同时 或 不 同时 刻 去 建立 ,修改 和 询问 数据 库 。 它 使 用 户 能 方便 地 定 
义 和 操 纵 数据 ,维护 数据 的 安全 性 和 完整 性 ,以 及 进行 多 用 户 下 的 并 发 控制 和 恢复 数据 库 。 


1.5.1 数据 库 管理 系统 的 组 成 


数 库 库 管理 系统 组 成 按 功能 划分 ,大 致 可 分 为 以 下 几 个 部 分 。 

(1) 模式 翻译 : 提供 数据 定义 语言 (DDL)。 用 它 书写 的 数据 库 模式 被 翻译 为 内 部 表 
示 。 数 据 库 的 逻辑 结构 ,完整 性 约束 和 物理 存储 结构 保存 在 内 部 的 数据 字典 中 。 数 据 库 的 
各 种 数据 操作 (如 查找 ,修改 、 插 入 和 删除 等 ) 和 数据 库 的 维护 管理 都 是 以 数据 库 模 式 为 依 
据 的 。 

(2) 应 用 程序 的 编译 : 把 包含 着 访问 数据 库 语 句 的 应 用 程序 ,编译 成 在 DBMS 支持 下 
可 运行 的 目标 程序 。 

(3) 交互 式 查询 : 提供 易 使 用 的 交互 式 查 询 语言 ,如 SQL。DBMS 负责 执行 查询 命令 ， 
并 将 查询 结果 显示 在 屏幕 上 。 

(4) 数据 的 组 织 与 存 取 : 提供 数据 在 外 围 存储 设备 上 的 物理 组 织 与 存 取 方法 。 

(5) 事务 运行 管理 : 提供 事务 运行 管理 及 运行 日 志 , 事 务 运行 的 安全 性 监控 和 数据 完 
整 性 检查 ,事务 的 并 发 控制 及 系统 恢复 等 功能 。 

(6) 数据 库 的 维护 : 为 数据 库 管理 员 提供 软件 支持 ,包括 数据 安全 控制 完整 性 保障 、 
数据 库 备份 ,数据库 重 组 以 及 性 能 监控 等 维护 工具 。 

基于 关系 模型 的 数据 库 管理 系统 已 日 至 完善 ,并 已 作为 商品 化 软件 广泛 应 用 于 各 行 各 
业 。 它 在 客户 机 /服务 器 结构 的 分 布 式 多 用 户 环境 中 的 应 用 ,使 数据 库 系 统 的 应 用 进一步 扩 
展 。 随 着 新 型 数据 模型 及 数据 管理 的 实现 技术 的 推进 ,可 以 预期 DBMS 软件 的 性 能 还 将 更 
新 和 完善 ,应 用 领域 也 将 进一步 拓宽 。 


1.5.2 数据 库 管理 系统 的 主要 功能 


数据 库 管 理 系 统 是 数据 库 系统 的 核心 组 成 部 分 。 数 据 库 管理 系统 功能 的 强 弱 因 系 统 而 
异 ,一 般 来 说 ,数据 库 管理 系统 完成 的 主要 功能 如 下 。 

1. 数据 库 定义 功能 

DBMS 提供 相应 数据 定义 语言 (DDL) 来 定义 数据 库 结构 ,DDL 用 于 刻画 数据 库 的 框 
架 , 并 被 保存 在 数据 字典 中 。 定 义 功能 包括 外 部 模式 、 概 念 模式 、 内 部 模式 及 模式 间 映 像 的 
定义 ( 详 见 1.4 节 数 据 库 系统 结构 ) ,数据 库 完 整 性 定义 ,安全 性 定义 , 存 取 路 径 等 的 定义 。 

2. 数据 存 取 功 能 

DBMS 提供 数据 操纵 语言 CDML) ,以 实现 对 数据 库 数 据 的 基本 存 取 操作 ,如 检索 、 插 
入 、 修 改 和 删除 。 

3. 数据 库 的 建立 和 维护 功能 

数据 库 的 建立 功能 是 指 DBMS 根据 数据 库 的 定义 ,把 实际 的 数据 库 数据 存储 到 物理 存 
储 设备 上 ,完成 实际 存放 数据 的 数据 库 ( 目 标 数据 库 ) 的 建 库 工作 。 

数据 库 的 维护 功能 主要 包括 数据 库 运行 时 记录 工作 日 志 , 监 视 数据 库 的 性 能 ,完成 数据 
库 的 重组 和 重 构 功能 。 重 组 是 指 DBMS 提供 重组 程序 用 来 重新 整理 零乱 的 数据 库 ,以 便 回 
收 已 删除 数据 所 占用 的 存储 空间 ,并 把 记录 从 溢出 区 移 到 主 数据 区 的 自由 空间 中 。 重 构 功 
能 是 指 DBMS 提供 重 构 程序 用 以 改善 数据 库 的 性 能 。 在 动态 环境 中 ,数据 库 运行 一 段 时 间 
后 数据 库 使 用 的 模式 与 最 初 设计 的 模式 有 了 改变 ,或 原来 构造 的 实体 联系 方法 需要 改变 ,或 
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新 的 应 用 要 求 增加 新 的 数据 类 型 。 此 时 ,数据 库 出 现 性 能 下 降 的 趋势 。 为 了 改善 数据 库 的 
性 能 , 需 对 数据 库 进 行 重 构 。 通 常 把 在 逻辑 模式 和 内 部 模式 上 的 改变 称 为 * 重 构 ”。 数 据 库 
重组 与 重 构 是 有 区 别 的 。 重 组 一 般 不 会 影响 现 有 的 应 用 程序 ,而 重 构 则 可 能 对 应 用 程序 
有 所 影响 。 除 上 述 之 外 ,DBMS 还 要 具备 数据 库 的 恢复 功能 。 由 于 硬件 和 软件 的 故障 ,或 
4 于 操作 上 的 失误 等 原因 会 导致 数据 库 系统 在 运行 过 程 中 产生 故障 ,致使 数据 库 中 数据 或 
某 些 程序 失效 。DBMS 的 故障 恢复 功能 ,就 是 为 这 种 情况 提供 最 有 效 的 措施 和 有 力 的 工 
具 , 如 提供 转 储 和 检查 点 等 手段 。 故 障 恢复 功能 可 把 故障 造成 的 影响 限制 在 最 小 的 范围 内 ， 
并 让 系统 以 最 快 的 速度 排除 故障 ,恢复 并 重新 启动 数据 库 系 统 , 使 故障 造成 的 损失 降 至 
最 小 。 

4. 数据 组 织 、 存 储 和 管理 功能 

DBMS 要 分 类 组 织 、 存 储 和 管理 数据 库 中 的 各 种 数据 ,包括 用 户 数 据 、 数 据 字 典 、 存 取 
路 径 等 。 要 确定 以 何 种 文件 结构 和 存 取 方 式 在 存储 设备 上 组 织 、 存 储 这 些 数 据 , 如 何 实现 数 
据 之 间 的 联系 ,以 提高 存储 空间 利用 率 和 存 取 效 率 。 

5. 通信 功能 

DBMS 具有 与 操作 系统 的 联机 处 理 、 分 时 系统 及 远程 作业 输入 的 相应 接口 ,负责 处 理 
数据 的 传送 。 对 网 络 环 境 下 的 数据 库 系 统 , 还 应 包括 DBMS 与 网 络 中 其 他 软件 系统 的 通信 
功能 ,数据 库 之 间 的 互 操作 功能 。 


1.5.3 数据 库 管理 系统 应 该 满足 的 要 求 


数据 库 管理 系统 的 基本 目标 是 提高 数据 管理 能 力 ,改善 数据 处 理性 能 ,使 用 户 能 方便 而 
灵活 地 处 理 和 使 用 数据 。 一 个 数据 库 管理 系统 应 该 满足 以 下 一 些 要求 。 

1. 容易 使 用 

由 于 数据 处 理 的 应 用 范围 广 ,用 户 较 多 ,这 些 用 户 大 多 是 非 数据 库 方面 的 专业 人 员 , 因 
此 ,他 们 希望 能 够 在 操作 方面 简单 易 用 。 

2. 数据 处 理 速度 快 并 且 能 力 强 

如 何 合理 将 数据 存放 在 数据 库 中 是 建立 数据 库 的 目的 之 一 ,但 更 重要 的 目的 是 为 了 对 
它 进行 操作 ,因此 ,用 户 希望 数据 处 理 的 速度 要 快 、 响 应 时 间 要 短 , 这 也 是 衡量 一 个 数据 库 系 
统 数据 处 理 能 力 的 一 个 重要 标志 。 

3. 具有 可 发 展 性 

一 个 数据 库 管理 系统 本 身 是 一 个 软件 ,对 于 一 个 软件 它 的 生命 周期 是 长 是 短 ,关键 要 看 
它 是 否 具 有 可 维护 性 ,维护 包括 完善 性 维护 改正 性 维护 、 适 应 性 维护 和 预防 性 维护 ,在 这 里 
可 发 展 性 包括 完善 性 维护 、 适 应 性 维护 和 预防 性 维护 的 含义 。 例 如 ,不 断 增加 数据 库 管理 系 
统 的 新 功能 \ 不 断 适应 新 的 环境 变化 等 。 

4. 具有 逻辑 数据 独立 性 和 物理 数据 独立 性 

在 前 面 已 经 讲 过 ,数据 独立 性 是 指数 据 库 中 数据 与 应 用 程序 的 无 关 性 。 对 于 一 个 数据 
库 管理 系统 ,用 户 希 望 当 插入 新 记录 或 删除 老 记 录 时 、 当 增加 一 个 新 的 应 用 程序 .使 用 已 有 
数据 、 当 数据 类 型 发 生变 化 时 等 情况 都 不 要 修改 应 用 程序 、 模 式 描述 和 物理 结构 ; 如 果 软 件 
修改 或 硬件 变动 等 情况 可 以 不 修改 应 用 程序 和 模式 描述 ,但 要 修改 物理 结构 ; 当 将 两 个 数 
据 库 合并 时 或 修改 全 局 逻辑 数据 时 可 以 不 修改 应 用 程序 ,但 要 修改 模式 描述 和 物理 结构 。 


也 就 是 希望 上 述 两 种 数据 独立 性 必须 由 DBMS 软件 提供 。 

5. 确保 数据 的 完整 性 

任何 一 个 数据 库 管理 系统 都 必须 保证 数据 的 完整 性 。 数 据 完整 性 指数 据 的 正确 性 和 一 
致 性 保护 ,包括 实体 完整 性 、 参 照 完 整 性 和 复杂 的 事务 规则 等 ,使 数据 项 及 数据 项 之 间 的 关 
系 不 受 破坏 ,使 数据 保持 一 致 

6. 具有 良好 的 数据 保密 性 和 安全 性 

数据 是 一 种 宝贵 的 资源 ,必须 防止 非法 人 员 存 取 和 使 用 。 目 前 ,关于 数据 库 的 安全 性 和 
保密 性 的 研究 非常 热门 ,如 何 有 效 地 保护 数据 ,作为 数据 库 管 理 系统 本 身 也 应 该 具有 一 定 的 
保护 措施 。 

7. 兼容 性 好 

兼容 性 包括 两 个 方面 ,一 个 是 硬件 兼容 ,一 个 是 软件 兼容 。 

对 于 硬件 尽管 不 同 的 计算 机 都 有 一 些 差 别 , 但 作为 数据 库 管 理 系统 软件 ,最 好 能 在 各 式 
各 样 的 计算 机 上 运行 。 

对 于 软件 兼容 ,由 于 数据 库 管理 系统 总 要 不 断 修 改 和 更 新 ,但 更 新 后 的 版 本 应 该 与 老 版 
本 的 数据 库 和 应 用 程序 兼容 ,同时 ,也 希望 与 其 他 数据 库 管 理 系统 兼容 ,例如 ,可 以 接受 其 他 
数据 库 管理 系统 的 输出 数据 ,可 以 使 用 其 他 数据 库 管理 系统 的 应 用 程序 等 。 

8. 和 谐 性 

一 般 来 说 ,不 同 用 户 评价 一 个 数据 库 系统 好 坏 的 观点 不 同 , 联 机 用 户 关心 系统 的 响应 时 
间 和 执行 操作 的 灵活 性 , 批 处 理 用 户 关心 系统 的 符 吐 量 和 运行 时 间 。 所 以 作为 一 个 数据 库 
管理 系统 必须 兼顾 不 同 的 要 求 。 

9. 逻辑 数据 结构 简单 

由 于 数据 库 的 应 用 面 广 , 使 用 数据 库 管理 系统 的 用 户 较 多 ,因此 ,要 求 整 个 数据 库 的 逻 
辑 视 图 应 力求 简单 明了 ,使 得 用 户 易于 理解 和 阅读 。 

10. 强 有 力 的 用 户 语言 

除了 具有 简单 的 逻辑 数据 结构 以 外 ,还 要 求 用 户 对 数据 库 的 操作 简单 ,以 便 容 易 使 用 ， 
所 以 要 求 数据 库 管理 系统 必须 提供 强 有 力 的 用 户 语言 ,用 户 通过 语言 可 以 方便 地 定义 、 查 
询 、 更 新 和 管理 ,控制 数据 库 。 

有 无 计算 机 辅助 软件 工程 工具 CASE 一 一 计算 机 辅助 软件 工程 工具 可 以 帮助 开发 者 根 
据 软 件 工 程 的 方法 提供 各 开发 阶段 的 维护 、 编 码 环境 ,便于 复杂 软件 的 开发 .维护 。 有 无 第 
四 代 语 言 的 开发 平台 一 一 第 四 代 语 言 具 有 非 过 程 语言 的 设计 方法 ,用 户 无 须 编写 复杂 的 过 
程 性 代码 ,易学 . 易 懂 、 易 维护 。 有 无 面向 对 象 的 设计 平台 一 一 面向 对 象 的 设计 思想 十 分 接 
近 人 类 的 逻辑 思维 方式 ,便于 开发 和 维护 。 对 多 媒体 数据 类 型 的 支持 一 一 多 媒体 数据 需求 
是 今后 发 展 的 趋势 ,支持 多 媒体 数据 类 型 的 数据 库 管理 系统 必 将 减少 应 用 程序 的 开发 和 维 
护 工作 。 

对 于 DBMS 的 要 求 除 上 述 要 求 外 ,用 户 在 不 同 环境 还 有 更 多 的 要 求 ,例如 : 

(1) 对 分 布 式 应 用 的 支持 。 

包括 数据 透明 与 网 络 透明 程度 。 数 据 透 明 是 指 用 户 在 应 用 中 无 须 指出 数据 在 网 络 中 的 
什么 节点 上 ,数据 库 管理 系统 可 以 自动 搜索 网 络 ,提取 所 需 数据 : 网 络 透明 是 指 用 户 在 应 用 
中 无 须 指 出 网 络 所 采用 的 协议 。 数 据 库 管理 系统 自动 将 数据 包 转 换 成 相应 的 协议 数据 。 
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(2) 并 行 处 理 能 力 。 

支持 多 CPU 模式 的 系统 (SMP,CLUSTER,MPP) ,负载 的 分 配 形式 ,并 行 处 理 的 颗粒 
度 和 范围 等 。 

(3) 可 移植 性 和 可 扩展 性 。 

可 移植 性 指 垂直 扩展 和 水 平 扩展 能 力 。 垂 直 扩 展 要 求 新 平台 能 够 支持 低 版 本 的 平台 ， 
数据 库 客户 机 /服务 器 机 制 支持 集 中 式 管理 模式 ,这样 可 保证 用 户 以 前 的 投资 和 系统 ; 水 平 
扩展 要 求 满足 硬件 上 的 扩展 ,支持 从 单 CPU 模式 转换 成 多 CPU 并 行 机 模式 。 

(4) 并 发 控制 功能 。 

对 于 分 布 式 数据 库 管理 系统 ,并 发 控制 功能 是 必 不 可 少 的 。 因 为 它 面临 的 是 多 任务 分 
布 环境 ,可 能 会 有 多 个 用 户 点 在 同一 时 刻 对 同一 数据 进行 读 或 写 操作 ,为 了 保证 数据 的 一 致 
性 ,需要 由 数据 库 管理 系统 的 并 发 控制 功能 来 完成 。 

(5) 数据 库 恢复 功能 。 

当 突 然 停电 、` 出 现 硬 件 故 障 、 软 件 失效 .病毒 或 严重 错误 操作 时 ,系统 应 提供 恢复 数据 库 
的 功能 ,如 定期 转 存 、 恢 复 备 份 和 回 滚 等 ,使 系统 有 能 力 将 数据 库 恢 复 到 某 一 正确 状态 。 


1.5.4 数据 库 管理 系统 程序 模块 的 组 成 


从 图 1-2 可 以 看 出 数据 库 管理 系统 是 一 个 复杂 的 软件 ,数据 库 管理 系统 由 众多 程序 模 
块 组 成 ,每 个 模块 完成 了 数据 库 管理 系统 的 一 部 分 功能 ,这 些 模 块 组 合 起 来 完成 了 复杂 的 
功能 。 

不 同 的 数据 库 管理 系统 由 于 程序 模块 不 同 , 完 成 的 功能 有 所 不 同 , 但 一 般 来 说 ,主要 由 
数据 库 定 义 , 数 据 库存 取 ,数据 库 运 行 处 理 , 数 据 库 组 织 ,存储 和 管理 ,数据 库 建 立 .维护 和 其 
他 主要 模块 组 成 ,如 图 1-27 所 示 。 


数据 库 管理 系统 程序 模块 组 成 
数据 库 数据 库 数据 库 运 数据 库 组 数据 库 建 
定义 存 取 行 处 理 织 、 存 储 和 | | 立 、 维 护 和 
管理 其 他 


图 1-27 数据 库 管理 系统 程序 模块 图 


1. 数据 库 定 义 

数据 库 定 义 主要 包括 模式 、 外 模式 、 存 储 模式 的 定义 模块 ,同时 还 包括 安全 性 和 完整 性 
的 定义 。 

如 在 关系 数据 库 管 理 系统 中 ,数据 库 定 义 就 是 创建 数据 库 . 表 、 视 图 .索引 等 ,安全 方面 
如 授权 定义 及 处 理 模块 ,完整 性 定义 如 关系 数据 库 管理 系统 的 实体 完整 性 参照 完整 性 和 用 
户 定义 完整 性 及 处 理 模 块 。 

这 些 模块 实质 上 是 数据 库 管 理 系统 中 语言 的 一 部 分 。 

任何 数据 库 管 理 系统 都 有 自己 的 语言 系统 ,如 程序 设计 语言 .定义 和 操作 数据 库 的 
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其 中 ,程序 设计 语言 对 于 不 同 的 系统 又 分 为 宿主 语言 和 自 含 语言 。 ep 
据 库 操纵 的 语言 作为 主语 言 的 一 种 扩充 ,例如 ,将 对 数据 库 的 操纵 嵌入 到 C 语言 中 ,然后 在 
C 语言 中 利用 扩充 的 语言 完成 对 数据 库 的 操作 。 oo 
译 解释 程序 ,不 需要 其 他 高 级 语言 的 支持 就 可 以 独立 完成 对 数据 库 的 操作 和 控制 ,如 目前 比 
较 流 行 的 Visual FoxPro。 

相对 于 主语 言 , 定 义 和 操 作 数据 库 的 语言 被 称 为 数据 子 语言 ,其 中 ,定义 ”用 于 描述 数 
据 库 ,简称 为 DDL;“ 操 作 ” 用 于 操作 数据 库 , 简 称 为 DML。 

数据 库 定义 主要 是 DDL 模块 ,这 些 DDL 程序 模块 接收 相应 的 定义 ,进行 语法 .语义 检 
查 , 并 且 把 它们 翻译 为 内 部 格式 存储 在 数据 字典 中 。 

2. 数据 库 操纵 

典型 的 数据 操纵 包括 : 检索 .插入 删除 和 修改 。 

这 些 程序 模块 主要 是 对 用 户 数 据 操纵 请 求 进行 语法 分 析 、 语 义 检 查 , 生 成 某 种 内 部 表 
示 , 优 化 处 理 , 生 成 目标 代码 等 ,然后 交 给 执行 模块 运行 ,完成 对 数据 库 的 操作 。 

3. 数据 库 运行 处 理 

主要 负责 系统 初始 化 ,建立 数据 库 管理 系统 的 系统 缓冲 区 、 系 统 工作 区 ,打开 数据 字典 
等 ,同时 还 包括 数据 库 监控 程序 ,数据 有 效 性 检查 程序 ,并 发 控制 程序 、 通 信 控 制程 序 等 。 一 
方面 保证 用 户 事务 的 正常 运行 ,一 方面 保证 数据 库 的 完整 性 和 安全 性 。 

4. 数据 库 组 织 ,存储 和 管理 

主要 包括 缓冲 区 管理 程序 模块 .文件 读 写 维护 程序 模块 、 存 取 路 径 管 理 维护 程序 模块 
等 ,主要 是 负责 维护 数据 库 的 数据 和 存 取 路 径 , 提 供 有 效 的 存 取 方法 。 

5. 数据 库 建 立 ,维护 和 其 他 方面 

主要 用 来 维护 数据 库 , 包 括 : 数据 库 装 和 人 程序、 无 用 数据 删除 程序 .重组 数据 库 程序 、 转 
储 复制 程序 .跟踪 程序 等 。 


1.5.5 数据 库 管理 系统 的 层次 结构 


数据 库 管理 系统 的 这 些 模块 互相 联系 与 依赖 ,共同 完成 复杂 的 功能 ,图 1-28 给 出 了 典 
型 的 数据 库 管理 系统 的 层次 结构 。 
由 图 1-28 可 以 看 出 ,根据 处 理 对 象 的 不 同 ,数据 


库 管理 系统 的 层次 结构 由 高 级 到 低级 依次 为 应 用 层 、 应 用 层 

语言 翻译 处 理 层 、 数 据 存 取 层 、 数 据 存储 层 和 操作 语言 翻译 处 理 层 

系统 。 数据 存 取 层 
(1) 应 用 层 。 应 用 层 是 DBMS 与 终端 用 户 和 应 本 汪 

用 程序 的 界面 层 ,处 理 的 对 象 是 各 种 各 样 的 数据 库 

应 用 。 二 


(2) 语言 翻译 处 理 层 。 语 言 翻 译 处 理 层 是 对 数 
据 库 语言 的 各 类 语句 进行 语法 分 析 、 视图 转换 、 授 权 
检查 、 完 整 性 检查 等 。 

(3) 数据 存 取 层 。 数 据 存 取 层 处 理 的 对 象 是 单 
个 元 组 , 它 将 上 层 的 集合 操作 转换 为 单 记录 操作 。 图 1-28 数据 库 管理 系统 的 层次 结构 
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(4) 数据 存储 层 。 数 据 存储 层 处 理 的 对 象 是 数据 页 和 系统 缓冲 区 。 
(5) 操作 系统 。 操 作 系统 是 DBMS 的 基础 。 操 作 系统 提供 的 存 取 原 语 和 基本 的 存 取 
方法 通常 是 作为 和 DBMS 存储 层 的 接口 。 


1.5.6 常见 的 数据 库 管 理 系统 


目前 有 许多 数据 库 产品 ,如 Oracle、Sybase、Informix、Microsoft SQL Server、 Microsoft 
Access、Visual FoxPro 等 ,每 个 产品 除了 具有 DBMS 的 基本 功能 以 外 ,各 自 还 具有 自己 特 
有 的 功能 ,在 数据 库 市 场 上 都 占有 一 席 之 地 。 下 面 简 要 介绍 几 种 常用 的 数据 库 管理 系统 。 

1. Oracle 

Oracle 是 一 个 最 早 商品 化 的 关系 型 数据 库 管 理 系 统 , 也 是 应 用 广泛 、 功 能 强大 的 数据 
库 管 理 系统 。Oracle 作为 一 个 通用 的 数据 库 管理 系统 ,不 仅 具 有 完整 的 数据 管理 功能 ,还 
是 一 个 分 布 式 数 据 库 系统 ,支持 各 种 分 布 式 功能 ,特别 是 支持 Internet 应 用 。 作 为 一 个 应 用 
开发 环境 ,Oracle 提供 了 一 套 界面 友好 ,功能 齐全 的 数据 库 开发 工具 。Oracle 使 用 PL/SQL 
执行 各 种 操作 ,具有 可 开放 性 、 可 移植 性 、 可 伸缩 性 等 功能 。 特 别 是 在 Oracle 8i 中 ,支持 面 
向 对 象 的 功能 ,如 支持 类 方法、 属性 等 ,使 得 Oracle 产品 成 为 一 种 对 象 /关系 型 数据 库 管理 
系统 。 

2. Microsoft SQL Server 

Microsoft SQL Server 也 是 目前 拥有 用 户 较 多 的 关系 型 数据 库 管 理 系 统 , 可 以 在 许多 
操作 系统 上 运行 , 它 使 用 Transact-SQL 完成 数据 操作 。 由 于 Microsoft SQL Server 是 开放 
式 的 系统 ,其 他 系统 可 以 与 它 进 行 完 好 的 交互 操作 。Microsoft SQL Server 版 本 很 多 ,如 
Microsoft SQL Server 2000 ,后 续 几 乎 每 两 年 发 布 一 个 新 的 版 本 ,微软 在 2016 年 3 月 宣布 
把 SQL Server 2016 带 到 Linux 平台 ,8 个 月 后 ,微软 推出 了 首 个 公共 预览 版 本 ,并 持续 带 来 
更 新 和 改进 。 目 前 ,微软 同时 向 Windows、Linux、Mac OS 以 及 Docker 容器 推出 了 SQL 
Server 2017 的 公共 访问 。 截 至 目前 ,该 公司 一 共 为 SQL Server 2017 推出 了 7 个 社区 预览 
版 ,引入 了 图 数据 处 理 支持 、 适 应 性 查询 、 面 向 高 级 分 析 的 Python 集成 等 功能 更 新 。 

3. Microsoft Access 

作为 Microsoft Office 组 件 之 一 的 Microsoft Access, 是 在 Windows 环境 下 非常 流行 的 
桌面 型 数据 库 管 理 系统 。 使 用 Microsoft Access 无 须 编 写 任何 代码 ,只 需 通过 直观 的 可 视 
化 操作 就 可 以 完成 大 部 分 数据 管理 任务 。 在 Microsoft Access 数据 库 中 ,包括 许多 组 成 数 
据 库 的 基本 要 素 。 这 些 要 素 是 存储 信息 的 表 、 显 示人 机 交互 界面 的 窗 体 、 有 效 检 索 数 据 的 查 
询 .信息 输出 载体 的 报表 、 提 高 应 用 效率 的 宏和 功能 强大 的 模块 工具 等 。 它 不 仅 可 以 通过 
ODBC 与 其 他 数据 库 相 连 ,实现 数据 交换 和 共享 ,还 可 以 与 Word 和 Excel 等 办 公 软 件 进行 
数据 交换 和 共享 ,并且 通 过 对 象 链接 与 嵌入 技术 在 数据 库 中 嵌入 和 链接 声音 、 图 像 等 多 媒体 
数据 。 


1.6 数据 库 应 用 系统 开发 概述 


在 1.4 节 中 重点 讨论 了 从 数据 库 管理 系统 角度 看 待 的 数据 库 系统 体系 结构 ,本 节 主 要 
从 用 户 角度 来 看 数据 库 系统 结构 , 即 从 数据 库 应 用 角度 来 介绍 数据 库 系 统 外 部 结构 。 


目前 ,根据 数据 库 系统 的 应 用 和 发 展 ,数据 库 系统 的 应 用 架构 主要 包括 单 用 户 结构 、 集 
中 式 结构 ,分布 式 结构 、 客 户 机 /服务 器 结构 、 浏 览 器 /服务 器 结构 。 


1.6.1 单 用 户 结构 


单 用 户 结构 是 指 在 个 人 计算 机 上 使 用 单 用 户 数据 库 系 统 , 即 整个 数据 库 系 统 ( 应 用 程 
序 .DBMS ,数据 ) 装 在 一 台 计 算 机 上 ,为 一 个 用 户 独 占 , 不 同 机 器 之 间 不 能 共享 数据 。 这 种 
类 型 的 数据 库 管 理 系统 虽然 在 数据 的 完整 性 .安全 性 以 及 并 发 控制 等 方面 还 存在 许多 不 足 ， 
但 基本 上 已 经 实现 了 数据 库 管 理 系 统 应 该 具有 的 功能 。 目 前 ,比较 流行 的 Microsoft 
Access 和 Visual FoxPro 就 比较 适合 单 用 户 结构 ,如 图 1-29 所 示 。 


1.6.2 集中 式 结构 

集中 式 结构 是 一 种 采用 大 型 主机 和 终端 结合 的 系统 ,这 种 结构 将 数据 库 系 统 ,包括 应 用 
程序 .DBMS 数据 都 集中 存放 在 主机 上 ,所 有 处 理 任务 都 由 主机 来 完成 ,各 个 用 户 通过 主机 
的 终端 并 发 地 存 取 数 据 库 ,共享 数据 资源 ,如 图 1-30 所 示 。 
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图 1-29 单 用户 结 构 图 1-30 集中 式 结构 


在 这 种 集中 式 结构 中 ,由 于 所 有 的 处 理 都 由 主机 完成 ,因此 对 主机 的 性 能 要 求 比较 高 ， 
但 这 种 结构 易于 管理 .控制 与 维护 。 不 足 之 处 是 当 终端 用 户 数目 增加 到 一 定 程度 后 ,主机 的 
任务 会 过 分 繁重 ,成 为 瓶颈 ,从 而 使 系统 性 能 下 降 。 系 统 的 可 靠 性 依赖 主机 ,当主 机 出 现 故 
障 时 ,整个 系统 都 不 能 使 用 。 
1.6.3 分 布 式 结构 

数据 库 中 的 数据 在 逻辑 上 是 一 个 整体 ,但 物理 地 分 布 在 计算 机 网 络 的 不 同 节点 上 。 网 
络 中 的 每 个 节点 都 可 以 独立 处 理 本 地 数据 库 中 的 数据 ,执行 局 部 应 用 ; 同时 也 可 以 同时 存 
取 和 处 理 多 个 异地 数据 库 中 的 数据 ,执行 全 局 应 用 ,如 图 1-31 所 示 。 

优点 : 适应 了 地 理 上 分 散 的 公司 .团体 和 组 织 对 于 数据 库 应 用 的 需求 。 

缺点 : 数据 的 分 布 存放 给 数据 的 处 理 、 管 理 与 维护 带 来 困难 。 

当 用 户 需 要 经 常 访问 远程 数据 时 ,系统 效率 会 明显 地 受到 网 络 传输 的 制约 。 
1.6.4 客户 机 /服务 器 结构 


客户 机 /服务 器 结构 ,简称 C/S 结构 。 在 这 种 结构 中 ,把 数据 库 管 理 系统 的 功能 和 应 用 
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1-31 分 布 式 结构 


分 开 。 网 络 中 某 个 ( 些 ) 节 点 上 的 计算 机 专门 用 于 执行 数据 库 管理 系统 功能 , 称 为 数据 库 服 
务 器 ,简称 服务 器 。 其 他 节点 上 的 计算 机 安装 数据 库 管理 系统 的 外 围 应 用 开发 工具 和 用 户 
的 应 用 系统 , 称 为 客户 机 。 客 户 机 主要 负责 管理 用 户 界 面 和 接收 用 户 数 据 , 并 且 处 理 相应 请 
求 ,产生 数据 库 服 务 请 求 ,然后 将 这 些 请 求 发 给 服务 器 ,并 且 接 收服 务 器 返回 的 结果 ,最 后 再 
将 这 些 结果 按照 一 定 的 格式 返回 给 用 户 。 服 务 器 的 主要 任务 是 接收 客户 机 的 请 求 , 并 且 处 
理 这些 请 求 ,然后 将 处 理 结果 返回 给 客户 机 。 

客户 机 /服务 器 数据 库 系 统 的 种 类 包括 集中 的 服务 器 结构 和 分 布 的 服务 器 结构 。 集 中 
的 服务 器 结构 中 有 一 台数 据 库 服务 器 ,多 台 客 户 机 ,如 图 1-32 所 示 。 
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图 1-32 客户 机 /服务 器 结构 


分 布 的 服务 器 结构 在 网 络 中 有 多 台数 据 库 服务 器 ,一 般 将 数据 控制 层 放 在 数据 库 服 务 
器 上 ,主要 的 业务 处 理 层 放 在 应 用 服务 器 上 实现 。 而 简单 的 业务 处 理 功 能 和 界面 表示 层 放 
在 客户 机 上 ,如 图 1-33 所 示 。 

客户 机 /服务 器 结构 的 好 处 是 整个 系统 具有 较 好 的 性 能 , 除 此 之 外 ,由 于 客户 端的 用 户 
请 求 被 传送 到 数据 库 服务 器 ,数据 库 服务 器 进行 处 理 后 ,只 将 结果 返回 给 用 户 , 从 而 显著 减 


客户 机 | 
2 服 人 有 应 史 让 服 


图 1-33 多 层 客 户 机 /服务 器 结构 


少 了 数据 传输 量 。 但 是 也 有 不 足 之 处 ,例如 ,相同 的 应 用 程序 要 重复 安装 在 每 一 台 客 户 机 
上 ,从 系统 总 体 来 看 ,大 大 浪费 了 系统 资源 ; 同时 当 系 统 规 模 达 到 数 百 数 千 台 客户 机 时 , 它 
们 的 硬件 配置 .操作 系统 又 常常 不 同 ,要 为 每 一 个 客户 机 安装 应 用 程序 和 相应 的 工具 模块 ， 
其 安装 维护 代价 便 不 可 接受 了 ; 并 且 这 种 结构 还 具有 应 用 维护 较 困 难 , 难 于 保密 ,造成 安全 
性 差 等 问题 。 


1.6.5 浏览 器 /服务 器 结构 


由 于 客户 机 /服务 器 结构 存在 一 些 不 方便 之 处 ,所 以 ,人 们 提出 了 改进 的 方法 ,即将 应 用 
程序 安装 eh 而 客户 机 端 只 安装 作为 前 端 运 行 环境 的 浏览 器 ,这 就 是 浏览 器 / 
服务 器 结构 。 这 种 结构 的 核心 是 Web 服务 器 , 它 负责 接收 远程 或 本 地 浏览 器 的 超 文本 传输 
Ma 然后 根据 查询 条 件 到 数据 库 服 务 器 获取 相关 的 数据 ,并 把 结果 翻译 
ee 提出 请 求 的 浏览 器 。 

种 结构 的 客户 端 由 于 浏览 器 的 界面 统一 ,广大 用 户 容易 掌握 ,因此 大 大 减少 了 培训 时 
ey 同时 由 于 服务 器 端 又 分 为 Web 服务 器 、 应 用 服务 器 和 数据 库 服务 器 等 ,所 以 ,大 
大 减少 了 系统 开发 和 维护 代价 ,能够 支持 数 万 甚至 更 多 的 用 户 。 如 图 1-34 所 示 为 多 层 B/S 


模式 结构 。 
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图 1-34 多 层 B/S 模式 结构 


该 结构 中 ,浏览 器 与 Web 服务 器 之 间 可 以 通过 HTTP 通信 ,Web 服务 器 与 应 用 服务 器 
之 间 采 用 CG1/ API 等 接口 通信 ,应 用 服务 器 DBMS 服务 器 可 以 利用 ODBC/JDBS 等 接口 
完成 数据 库 的 操作 。 

说 明 : 基于 数据 库 管 理 系统 开发 应 用 系统 有 很 多 好 处 ,但 并 不 是 所 有 的 应 用 系统 都 必 
须 基 于 数据 库 管 理 系 统 开发 ,例如 ,苛刻 的 实时 (Real-Time) 环 境 ; 应 用 系统 要 求 的 操作 非 
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常 少 ,并 且 代码 要 求 精练 ; 操作 的 数据 是 非 结构 化 或 半 结 构 化 数据 ,等 等。 
“1.7 数据 库 技术 的 新 发 展 


数据 库 技 术 从 20 世纪 60 年 代 中 期 产生 到 今天 发 展 速度 之 快 ,使 用 范围 之 广 是 其 他 技 
术 所 远 不 及 的 。 了 解 当前 数据 库 技术 的 进展 ,研究 数据 库 发 展 的 动向 ,对 数据 库 技术 的 研究 
和 应 用 具有 重大 的 意义 。 

近年 来 ,数据 库 技术 与 计算 机 网 络 、 人 工 智 能 软件 工程 等 其 他 学 科 的 内 容 相 结合 ,不断 
形成 了 新 的 发 展 方向 ,涌现 出 各 种 新 型 的 数据 库 , 这 也 是 新 一 代数 据 库 的 一 个 显著 特征 。 现 
举例 说 明 如 下 。 

1. 分 布 式 数 据 库 

分 布 式 数 据 库 与 集中 式 数据 库 联 网 和 分 散 式 数据 库 是 不 同 的 。 集 中 式 数据 库 联网 是 指 
集中 式 数据 库 用 网 络 连接 起 来 。 分 散 式 数 据 库 是 指使 分 散在 各 个 场地 上 的 集中 式 数据 库 可 
以 被 网 络 上 的 用 户 通过 远程 登录 加 以 访问 ,或 者 通过 网 络 传递 数据 库 中 的 数据 。 分 布 式 数 
据 库 是 指 将 其 数据 实体 存储 在 地 理 位 置 上 分 散 的 计算 机 网 络 节点 上 ,而 概念 上 是 单一 的 集 
中 的 数据 库 , 其 分 布 性 对 用 户 是 透明 的 。 也 可 以 说 分 布 式 数据 库 是 由 一 组 数据 组 成 ,这 些 数 
据 物 理 上 分 布 在 计算 机 网 络 的 不 同 节点 上 ,逻辑 上 属于 同一 个 系统 。 分 布 式 数据 库 重点 强 
调 两 点 : 分 布 性 ; @ 逻 辑 整体 性 。 

20 世纪 80 年 代 研制 了 许多 分 布 式 数据 库 的 原型 系统 ,攻克 了 分 布 式 数据 库 中 许多 理 
论 和 技术 难点 。20 世纪 90 年 代 开 始 主 要 的 数据 库 厂商 对 集中 式 数据 库 管理 系统 的 核心 加 
以 改造 ,逐步 进入 分 布 处 理 功能 ,向 分 布 式 数据 库 管理 系统 发 展 。 目 前 ,分 布 式 数据 库 开始 
进入 实用 阶段 。 

2. 并 行 数据 库 

并 行 数据 库 是 在 并 行 机 上 运行 的 具有 并 行 处 理 能 力 的 数据 库 系统 。 

最 近 十 几 年 来 ,并 行 计算 机 系统 的 发 展 十 分 迅速 ,许多 公司 推出 了 很 多 商品 化 的 高 性 能 
并 行 计算 机 系统 ,但 是 ,并 行 计算 机 软件 系统 的 发 展 却 远 远 落后 于 硬件 的 发 展 ,至 今 尚未 有 
实用 的 并 行 计算 机 操作 系统 、 并 行 编译 系统 、 并 行 数据 库 系统 、 并 行 智能 系统 等 并 行 软件 投 
入 运行 。 因 此 ,并 行 软件 的 研究 已 经 成 了 最 近 几 年 来 热门 的 高 科技 研究 领域 。 

由 于 各 种 应 用 领域 中 数据 库 系统 占有 重要 的 地 位 ,并 行 数据 库 系统 的 研究 引起 了 学 术 
界 和 工业 界 的 特别 关注 。 特 别 是 随 着 计算 机 应 用 领域 的 不 断 扩 大 ,数据 库 规模 越 来 越 大 , 数 
据 查询 也 越 来 越 复 杂 , 对 数据 库 管理 系统 性 能 的 要 求 越 来 越 高 ,基于 传统 的 汉 “， 诺 依 曼 计算 
机 的 数据 库 管 理 系统 已 经 难以 适应 迅速 增长 的 性 能 要 求 ,数据 库 管 理 系统 性 能 的 提高 已 经 
成 为 目前 急需 解决 的 问题 。 

目前 ,并 行 数据 库 系统 的 研究 基本 围绕 着 关系 数据 库 进 行 ,并 且 主 要 包括 数据 库 中 数据 
的 划分 及 其 在 多 处 理 器 或 多 磁盘 之 间 的 分 布 ; 并 行 数据 操作 算法 的 设计 与 实现 ; 并 行 数据 
库 的 查询 优化 。 

3. 演绎 数据 库 、 知 识 库 和 主动 数据 库 

演绎 数据 库 是 在 数据 库 的 基础 上 发 展 起 来 的 一 种 扩充 形式 的 数据 库 。 在 演绎 数据 库 中 
不 但 引入 了 事实 与 完整 性 约束 ,也 引入 了 规则 。 由 于 规则 的 引入 ,使 得 由 已 知 的 事实 通过 规 


则 可 以 推演 出 未 知 的 事实 。 

知识 库 是 知识 的 集合 ,这 些 知 识 包括 : 概念 .事实 与 规则 。 

主动 数据 库 是 相对 传统 数据 库 的 被 动 性 而 言 的 。 许 多 实际 的 应 用 领域 ,如 计算 机 集成 
制造 系统 、 管 理 信息 系统 、 办 公 室 自动 化 系统 中 常常 希望 数据 库 系 统 在 紧急 情况 下 能 根据 数 
据 库 的 当前 状态 ,主动 适时 地 做 出 反应 ,执行 某 些 操作 ,向 用 户 提供 有 关 人 信息。 传统 数据 库 
系统 是 被 动 的 系统 , 它 只 能 被 动 地 按照 用 户 给 出 的 明确 请 求 执行 相应 的 数据 库 操 作 ,很 难 充 
分 适应 这 些 应 用 的 主动 要 求 , 因 此 在 传统 数据 库 基 础 上 ,结合 人 工 智能 技术 和 面向 对 象 技术 
提出 了 主动 数据 库 。 

主动 数据 库 主要 解决 主动 数据 库 的 数据 模型 .知识 模型 .执行 模型 .条 件 检 测 、 事 务 调 
度 、 体 系 结构 和 系统 效率 。 主 动 数据 库 是 目前 数据 库 技术 中 一 个 活跃 的 研究 领域 ,近年 来 的 
研究 已 取得 了 很 大 的 成 果 。 当 然 ,主动 数据 库 还 是 一 个 正在 研究 的 领域 ,许多 概念 尚 不 成 
熟 ,不 少 技术 问题 还 有 待 进一步 研究 解决 。 

4. 多 媒体 数据 库 

传统 的 数据 库 管理 的 都 是 以 数值 和 字符 数据 为 管理 对 象 , 其 应 用 对 象 主要 是 一 般 的 商 
业 或 事务 数据 , 它 可 以 不 涉及 诸如 图 像 .声音 等 , 当 数 据 库 管理 对 象 被 扩充 到 用 以 管理 多 媒 
体 数 据 之 后 ,其 性 质 和 功能 都 产生 了 重大 的 变化 。 其 存储 结构 和 存 取 结构 不 同 ,描述 它们 的 
数据 结构 和 数据 模型 也 不 同 ,由 此 产生 的 用 于 管理 多 媒体 数据 的 数据 库 管理 系统 ,就 是 多 媒 
体 数据 库 管理 系统 。 

多 媒体 技术 是 20 世纪 80 年 代 发 展 起 来 的 计算 机 新 技术 。 目 前 来 看 ,对 多 媒体 的 支持 
还 是 很 有 限 的 ,主要 支持 是 在 系统 中 只 引入 新 的 数据 类 型 ,以 便 存储 多 媒体 对 象 字段 ,如 
VFP 的 OLE 字段 .Access 的 通用 字段 等 。 

5. 模糊 数据 库 

为 了 使 数据 库 描述 的 模型 更 贴切 地 反映 客观 世界 的 本 来 面目 ,不 仅 在 静态 结构 上 ,而 且 
在 动态 的 操作 和 变换 上 更 贴切 地 描述 客观 事物 ,有 必要 把 不 完全 性 .不 确定 性 和 模糊 性 引进 
数据 库 。 即 允许 在 数据 库 中 存放 一 些 模 糊 数据 和 不 确定 数据 。 

目前 ,无 论 国 内 还 是 国外 关于 模糊 数据 库 的 理论 和 技术 的 研究 ,都 尚 处 于 初创 阶段 , 远 
未 达到 成 熟 和 完善 ,还 有 待 长 期 而 深入 的 研究 。 

除 上 述 之 外 ,数据 库 技 术 被 应 用 到 特定 的 领域 中 ,出 现 了 工程 数据 库 、 地 理 数 据 库 .统计 
数据 库 .科学 数据 库 .空间 数据 库 等 多 种 数据 库 ,使 数据 库 领域 中 的 技术 内 容 层 出 不 穷 。 

关于 数据 库 最 新 技术 的 发 展 在 书 中 第 9 章 有 详细 介绍 。 


小 结 


本 章 首 先 重点 介绍 了 几 个 有 关 数 据 库 的 基本 概念 : 数据 库 、 数 据 库 管 理 系统 、 数 据 库 系 
统 ; 然后 介绍 了 数据 管理 技术 的 发 展 , 主 要 经 历 了 人 工 管理 阶段 .文件 系统 阶段 和 数据 库 系 
统 阶段 ; 并 且 介绍 了 数据 库 系统 的 特点 。 

其 次 ,本 章 讨 论 了 数据 模型 。 数 据 模 型 是 指 现实 世界 数据 和 信息 的 模拟 ,在 从 现实 世界 
到 计算 机 世界 的 抽象 过 程 中 ,要 求 必须 具备 真实 性 、 易 理解 性 和 易 实 现 性 。 重 点 介绍 了 概念 
模型 中 的 实体 -联系 模型 和 关系 数据 模型 。 


雪 论 


击 一 蛋 
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重点 讨论 了 数据 库 系 统 三 级 模式 和 两 级 映像 的 体系 结构 , 即 外 模式 、 模 式 和 内 模式 
及 外 模式 /模式 和 模式 /内 模式 的 映像 。 并 且 重 点 讲述 了 数据 库 管理 系统 ,包括 数据 库 管 
理 系统 的 组 成 ,主要 功能 、 应 该 满足 的 要 求 ,程序 模块 的 组 成 .层次 结构 和 常见 的 数据 库 
管理 系统 。 

介绍 了 数据 库 应 用 系统 目前 常用 的 几 种 结构 ,包括 单 用 户 结构 、 集 中 式 结构 ,分布 式 、 客 
户 机 /服务 器 结构 和 浏览 器 /服务 器 结构 。 

最 后 简单 介绍 了 数据 库 技术 的 新 发 展 。 


习 题 1 


1.1 名 词 解 释 。 

数据 库 (DB) 数据库 系统 (DBS) 数据 库 管 理 系统 CDBMS) 数据 模型 ”概念 数据 模型 
一 对 一 联系 ”一 对 多 联系 ”多 对 多 联系 ”层次 模型 ”网 状 模型 关系 模型 ”关键 字 模式 
外 模式 ”内 模式 ”数据 独立 性 ”人 逻辑 数据 独立 性 ”物理 数据 独立 性 ”数据 字典 (DD) 

1.2 简 答 。 

(1) 举例 说 明 哪些 应 用 适合 使 用 文件 系统 而 不 适合 使 用 数据 库 系 统 , 哪 些 应 用 适合 使 
用 数据 库 系统 而 不 适合 使 用 文件 系统 。 

(2) 文件 系统 与 数据 库 系统 有 何 区 别 和 联系 ? 

(3) 何谓 数据 的 物理 独立 性 与 数据 的 逻辑 独立 性 ? 

(4) 什么 是 数据 独立 性 ? 在 数据 库 系统 体系 结构 中 是 如 何 体现 的 ? 

(5) 数据 模型 的 三 要 素 。 

(6) 概念 模型 的 作用 。 

(7) 举例 说 明 实体 集 之 间 具 有 1 : 1、1 :nwm :nn 的 联系 。 

(8) 层次 数据 模型 .网 状 数据 模型 和 关系 数据 模型 的 优点 和 缺点 。 

(9) 举例 说 明 E-R 图 的 构成 规则 。 
0) 什么 是 外 部 模式 ?概念 模式 ? 内 部 模式 ? 它们 之 间 有 何 联系 ? 这 种 分 级 结构 的 
优点 是 什么 ? 
(11) 关系 数据 库 完 整 性 约束 有 哪些 ?举例 说 明 。 
(12) DBA 的 主要 职责 是 什么 ? 
(13) 用 户 访问 数据 库 的 过 程 。 
(14) 什么 是 数据 字典 ? 它 在 数据 库 中 的 作用 是 什么 ? 
(15) 简 述 数据 库 数据库 管理 系统 和 数据 库 系 统 之 间 的 关系 。 
(16) 给 出 层次 模型 和 网 状 模型 的 概念 ,并 各 给 出 一 个 实例 。 
( 
( 
1 
( 


一 


7) 你 认为 选择 数据 库 管 理 系统 的 主要 原则 有 哪些 ? 
18) 给 出 三 个 具体 DBMS 的 主要 特点 和 适用 场合 。 
.3 判断 。 

) 数据 库 系统 的 一 个 主要 特点 是 数据 无 元 余 。 

(2) 数据 库 管 理 系统 和 数据 库 构 成 了 数据 库 系统 。 
(3) 数据 结构 化 是 数据 库 和 文件 系统 的 根本 区 别 。 


(4) 
(5) 
(6) 
‘yy 
(8) 
(9) 


一 个 数据 库 系统 设计 中 ,概念 模式 只 有 一 个 ,而 外 模式 则 可 有 多 个 。 
数据 库 系统 中 数据 具有 完全 独立 性 。 

DBA 的 主要 职责 是 管理 数据 库 中 的 数据 。 

数据 库 避 免 了 一 切 数据 重复 。 

每 一 种 DBMS 的 实现 , 均 是 建立 在 某 一 种 数据 模型 基础 之 上 的 。 
非 过 程 化 语言 比 过 程 化 语言 好 。 


(10) 模式 是 数据 库 全 局 逻辑 结构 的 描述 。 

(11) 三 级 模式 结构 是 数据 库 唯一 的 一 种 分 级 模式 结构 。 

(12) 层次 数据 模型 和 网 状 数据 模型 都 可 用 关系 数据 模型 表示 。 

(13) 关系 模型 不 仅 可 以 描述 实体 ,还 可 以 描述 实体 及 实体 集 之 间 的 联系 。 
(14) 关系 数据 模型 与 网 状 数据 模型 相 比 具有 查询 效率 高 的 优点 。 

(15) 网 状 数据 模型 可 以 直接 表示 M : N 的 联系 。 

(16) 概念 模型 独立 于 硬件 设备 和 DBMS 。 

(17) 视图 对 重 构 数 据 库 提 供 了 一 定 程 度 的 物理 独立 性 。 

(18) 实体 是 信息 世界 中 的 术语 ,与 之 相对 应 的 数据 库 术 语 为 字段 。 

(19) 数据 库 系统 的 核心 工作 就 是 完成 用 户 级 数据 库 、 概 念 级 数据 库 和 物理 级 数据 库 之 


间 的 映射 。 
(20) 一 个 网 状 数据 结构 模型 可 以 变换 为 一 个 等 价 的 层次 数据 结构 模型 ,这 种 变换 以 存 
储 空间 为 代价 。 


1.4 


(1) 


(2) 


(3) 


(4) 


(5) 


(6) 


(7) 


选择 题 。 

在 ( ) 中 一 个 节点 可 以 有 多 个 双亲 ,节点 之 间 可 以 有 多 种 联系 。 

A. 网 状 模型 B. 关系 模型 C. 层次 模型 D. 以 上 都 有 
数据 库 管 理 系 统 CDBMS) 是 ( ys 

A. 一 个 完整 的 数据 库 应 用 系统 B. 一 组 硬件 

C. 一 组 软件 D. 既 有 硬件 ,也 有 软件 

用 户 或 应 用 程序 看 到 的 那 部 分 局 部 逻辑 结构 和 特征 的 描述 是 ( ) 模 式 。 

A. 模式 B. 物理 模式 C. 子 模式 D. 内 模式 


要 保证 数据 库 的 逻辑 数据 独立 性 ,需要 修改 的 是 ( Ys 
A. 模式 与 外 模式 之 间 的 映射 B. 模式 与 内 模式 之 间 的 映射 


C. 模式 D. 三 级 模式 
下 列 4 项 中 ,不 属于 数据 库 系 统 特点 的 是 ( i 

A. 数据 共享 B. 数据 完整 性 
C. 数据 元 余 度 高 D. 数据 独立 性 高 


数据 库 (DB) ,数据 库 系 统 (DBS) 和 数据 库 管 理 系统 (DBMS) 之 间 的 关系 是 ( 

A. DBS 包括 DB 和 DBMS B. DBMS 包括 DB 和 DBS 

C. DB 包括 DBS 和 DBMS D. DBS 就 是 DB, 也 就 是 DBMS 
数据 库 系统 与 文件 系统 的 主要 区 别 是 ( D's 

A. 数据 库 系统 复杂 ,而 文件 系统 简单 

B. 文件 系统 不 能 解决 数据 元 余 和 数据 独立 性 问题 ,而 数据 库 系统 可 以 解决 
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C. 文件 系统 只 能 管理 程序 文件 ,而 数据 库 系统 能 够 管理 各 种 类 型 的 文件 
D. 文件 系统 管理 的 数据 量 较 少 , 而 数据 库 系统 可 以 管理 庞大 的 数据 量 
(8) 数据 库 的 概念 模型 独立 于 ( Ds 


A. 具体 的 机 器 和 DBMS B. E-R 图 

C. 信息 世界 D. 现实 世界 
(9) 在 数据 库 中 存储 的 是 ( Ns 

A. 数据 B. 数据 模型 

C. 数据 以 及 数据 之 间 的 联系 D. 信息 


(10) 在 数据 库 中 ,数据 的 物理 独立 性 是 指 ( 污 
A. 数据 库 与 数据 库 管理 系统 的 相互 独立 
B. 用 户 程 序 与 DBMS 的 相互 独立 
C. 用 户 的 应 用 程序 与 存储 在 磁盘 上 的 数据 库 中 的 数据 是 相互 独立 的 
D. 应 用 程序 与 数据 库 中 数据 的 逻辑 结构 相互 独立 
(11) 数据 库 的 特点 之 一 是 数据 的 共享 ,严格 地 讲 ,这 里 的 数据 共享 是 指 ( 5 
A. 同一 应 用 中 的 多 个 程序 共享 一 个 数据 集合 
B. 多 个 用 户 、 同 一 种 语言 共享 数据 
C. 多 个 用 户 共享 一 个 数据 文件 
D. 多 种 应 用 、 多 种 语言 .多 个 用 户 相 互 覆盖 地 使 用 数据 集合 
(12) 在 数据 库 技术 中 ,为 提高 数据 库 的 逻辑 独立 性 和 物理 独立 性 ,数据 库 的 结构 被 划 
分 成 用 户 级 、( ) 和 存储 级 三 个 层次 


A. 管理 员 级 B. 外 部 级 C. 概念 级 D. 内 部 级 
(13) 在 数据 库 中 ,产生 数据 不 一 致 的 根本 原因 是 ( DD 

A. 数据 存储 量 太 大 B. 没有 严格 保护 数据 

C. 未 对 数据 进行 完整 性 控制 D. 数据 元 余 
(14) 数据 库 具有 (1) 、 最 小 的 (2) 和 较 高 的 程序 与 数据 (3)。 
@D  A. 程序 结构 化 B. 数据 结构 化 C. 程序 标准 化 D. 数据 模块 化 
@ A. 宛 余 度 B. 存储 量 C. 完整 性 D. 有 效 性 
@ A. 可 靠 性 B. 完整 性 C. 独立 性 D. 一 致 性 


(15) 在 数据 库 的 三 级 模式 结构 中 ,描述 数据 库 中 全 体 数据 的 多 辑 结构 和 特征 的 
是 ( 
A. 外 模式 B. 内 模式 C. 存储 模式 D. 模式 

1.5 设计 一 个 学 生 档案 管理 系统 ,学 生 的 信息 主要 包括 学 生 的 学 号 、 姓 名、 性 别人 学 
年 份 .出 生日 期 .联系 电话 、 宿 舍 等 ,和 学 生 相关 的 信息 还 有 学 生 所 在 学 院 . 所 学 专业 .所 在 班 
级 .班主 任 等 。 其 中 ,一 个 学 院 可 以 有 多 个 专业 ,一 个 专业 可 以 有 多 个 班级 ,一 个 专业 只 属于 
某 个 学 院 ,一 个 班级 也 只 属于 某 个 专业 ,一 个 班级 只 能 有 一 个 班主 任 , 一 个 班主 任 也 只 能 
带 一 个 班级 ,学 院 信息 包 括 学 院 代号 ,学院 名 称 、 学 院 负责 人 ,专业 信息 包括 专业 代号 . 专 
业 名 称 、 专 业 负 责 人 ,班级 信息 包括 班级 代号 、 班 级 名 称 , 班 主任 信息 包括 工 号 、 姓 名 、 职 
称 , 和 班主 任 有 关 的 信息 包括 所 在 学 院 和 所 在 系 部 ,一 个 教师 只 能 在 一 个 学 院 下 的 一 个 
系 部 工作 。 


要 求 : 

(1) 确定 有 哪些 实体 ,每 个 实体 包括 哪些 属性 。 

(2) 找 出 实体 间 的 联系 。 

(3) 画 出 ER 图 。 

1.6 在 1.5 题 设计 基础 上 再 多 加 一 些 考虑 因素 ,继续 完成 上 述 三 个 要 求 。 例 如 ,可 以 
考虑 学 生 的 学 籍 变动 情况 (休学 .退学 和 留级 等 ) ,奖惩 情况 的 记录 等 。 


霓 论 


击 一 蛋 


第 2 章 关系 数据 库 


关系 数据 库 是 支持 关系 模型 的 数据 库 系统 ,简称 RDBS。 关 系 模型 不 仅 数据 结构 简单 
清晰 ,而且 具 有 坚实 的 理论 基础 ,这 使 得 关系 数据 库 成 为 应 用 最 为 广泛 的 数据 管理 技术 。 自 
1970 年 E. F. Codd 提出 了 关系 数据 模型 以 来 ,其 理论 研究 和 软件 研制 均 取得 了 丰富 的 成 
果 。 目 前 许多 企业 的 在 线 交易 处 理 系统 .内 部 财务 系统 、 客 户 管理 系统 等 均 采用 关系 数据 库 
管理 系统 (RDBMS ) 。 

RDBMS 种 类 很 多 ,从 具有 良好 的 应 用 开发 环境 .用户 量 大 和 可 在 多 平台 上 安装 使 用 几 
方面 考虑 ,处 于 前 列 的 是 美国 Oracle 公司 的 Oracle 数据 库 ,Sybase 公司 的 Sybase 数据 库 ， 
加 州 大 学 的 Ingres 数据 库 ,Informix 公司 的 Informix 数据 库 ,IBM 公司 的 DB2 数据 库 , 以 
及 Microsoft 公司 的 SQL Server 数据 库 等 。 随 着 数据 库 产品 的 商业 化 ,关系 数据 库 系 统 的 
应 用 领域 迅速 扩大 ,成 为 目前 最 重要 、 应 用 最 广泛 的 数据 库 系统 。 因 此 ,关系 数据 模型 相关 
的 原理 及 应 用 十 分 重要 ,是 本 书 的 重点 。 

在 本 章 介 绍 关系 数据 模型 相关 理论 的 基础 上 ,本 书后 续 章节 将 陆续 介绍 有 关 关 系数 据 
库 的 问题 ,如 第 3 章 关 系数 据 库 的 标准 语言 SQL, 第 4 章 关 系 的 规范 化 理论 ,第 5 章 数据 库 
的 设计 等 。 本 章 作为 后 续 章 节 的 基础 ,主要 介绍 关系 的 定义 .关系 的 代数 操作 关系 演算 . 关 
系 的 查询 优化 及 关系 系统 的 分 类 和 定义 等 内 容 。 


2.1 关系 模型 


关系 模型 是 由 关系 数据 结构 .关系 操作 和 关系 完整 性 约束 三 部 分 组 成 的 。 在 1. 3. 3 节 
中 对 关系 模型 的 相关 概念 已 经 做 了 介绍 ,但 并 未 深入 讨论 其 数学 基础 ,本 节 将 在 集合 论 的 基 
础 上 对 关系 进行 定义 。 


2.1.1 关系 数据 结构 


关系 模型 中 数据 的 逻辑 结构 是 一 张 二 维 表 , 虽 然 结构 简单 但 是 语义 丰富 ,现实 世界 中 的 
实体 以 及 实体 之 间 的 联系 均 可 以 通过 关系 模型 进行 描述 。 

在 介绍 关系 的 数学 定义 之 前 ,需要 先 理解 一 些 基本 术语 。 

1. 域 

定义 2.1 域 (Domain) 是 一 组 具有 相同 数据 类 型 的 值 的 集合 。 

例如 ,自然 数 、 整 数 、{ 男 , 女 }、 大 于 等 于 0 的 实数 等 。 可 以 看 出 ,同一 域 中 的 元 素 必须 是 
相同 的 数据 类 型 。 

2. 笛 卡 儿 积 

定义 2.2 给 定 一 组 域 Di ,D;,…,D, (其 中 允许 有 相同 的 域 ),Di ,D: ,…,D, 上 的 笛 卡 


儿 积 用 公式 表示 为 : 
D, XD: X…XD,={(d ,d ,…,d)1diEDi,i 一 1,2，…，,z)} 
其 中 ， 
(1) 每 个 元 素 (d ,d ,…,d,) 称 为 一 个 元 组 (x-tuple) 或 简称 元 组 (Tuple); 
(2) 元 组 中 每 个 di 称 为 一 个 分 量 (Component); 
(3) 车 Di(i 二 1,2,…,n) 为 有 限 集 , 其 基数 (Cardinal Number) 为 mi;(i 二 1,2,…,n), 则 


Di XD; X…XD, 的 基数 M 为: M = Hm. 


式 中 : mi 为 第 i 个 域 的 基数 ,n 为 域 的 个 数 。 
笛 卡 儿 积 也 可 以 用 一 个 二 维 表 表示 。 表 中 的 每 一 行 对 应 一 个 元 组 ,每 一 列 对 应 一 个 域 。 
例如 , 设 有 三 个 域 ,Di 为 姓名 集合 ,D; 为 性 别 集合 ,D; 为 小 说 名 集合 : 
D,={ 唐 僧 , 泉 江 , 林 集 玉 } 
二 { 男 , 女 } 
D; 二 {西游 记 , 水 浒 传 ,红楼 梦 } 

则 以 上 三 个 域 的 笛 卡 儿 积 为 : 

D1 XD:XxD:={{ 唐 僧 , 男 } ,{ 宋 江 , 男 },{ 林 焦 玉 , 男 }， 

{ 唐 僧 , 女 } ,{ 宋 江 , 女 },{ 林 售 玉 , 女 }} XD， 
{{ 唐 僧 , 男 ,西游 记 },{ 宋 江 , 男 ,西游 记 },{ 林 袋 玉 , 男 , 西 游记 } ， 
{ 唐 僧 , 女 ,西游 记 },{ 宋 江 , 女 ,西游 记 },{ 林 袋 玉 , 女 ,西游 记 }， 
{ 唐 僧 , 男 ,水 浒 传 },{ 宋 江 , 男 ,水 游 传 },{ 林 袋 玉 , 男 , 水 游 传 }， 
{ 唐 僧 , 女 ,水 浒 传 },{ 宋 江 , 女 ,水 游 传 },{ 林 袋 玉 , 女 ,水 游 传 }， 
{ 唐 僧 , 男 ,红楼 梦 },{ 宋 江 , 男 ,红楼 梦 },{ 林 袋 玉 , 男 ,红楼梦 } ， 

{ 唐 僧 , 女 ,红楼梦 },{ 宋 江 , 女 ,红楼 梦 },{ 林 袋 玉 , 女 ,红楼梦 } } 
它 表 示 所 有 可 能 的 组 合 ,其 中 ,{ 唐 僧 , 男 ， ee ,{ 唐 僧 , 女 ,西游 记 },{ 唐 僧 , 男 ,水 游 传 }， 
{ 唐 僧 , 女 ,水 游 传 },{ 唐 僧 , 男 ,红楼 梦 },{ 唐 僧 , 女 ,红楼 梦 } 等 都 是 元 组 。 唐 僧 、. 宋 江 、 林 黛 
玉 、 男 、 女 、 西 游记 ,水 浒 传 、 eon hs 
3.2.3, 因 此 该 笛 卡 儿 积 的 基数 为 3X2X3=18, 一 共 得 到 18 个 元 组 。 这 18 个 元 组 可 列 为 
一 张 二 维 表 , 如 表 2-1 所 示 。 


表 2-1 D,、D;、D, 的 笛 卡 儿 积 


D， D; D; D， D; D; 
唐僧 男 西游 记 唐僧 女 水 游 传 
宋江 男 西游 记 宋江 女 水 浒 传 
林 袋 玉 男 西游 记 林 集 玉 女 水 浒 传 
唐僧 Ee 西游 记 唐僧 男 红楼 梦 
宋江 女 西游 记 宋江 男 红楼 梦 
林 仿 玉 女 西游 记 林 仿 玉 男 红楼 梦 
唐僧 男 水 浒 传 唐僧 女 红楼 梦 
宋江 男 水 浒 传 宋江 女 红楼 梦 
林 仿 玉 男 水 浒 传 林 焦 玉 女 红楼 梦 
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3. 关系 

定义 2.3 一 组 域 笛 卡 儿 乘积 的 一 个 子 集 称 为 一 个 关系 。 即 当 且 仅 当 入 是 D, Xx 
D: X…XD, 的 一 个 子 集 , 则 称 R 是 D,XDs X…XD, 上 的 一 个 关系 , 记 为 : 

RD ,D: ,…,D,) 
其 中 ,R 表示 关系 的 名 字 ,n 为 关系 的 目 或 度 (Degree) ,R 中 包含 的 元 组 个 数 称 为 R 的 基数 。 
关系 是 笛 卡 儿 积 的 子 集 , 因 此 关系 可 表示 为 一 个 二 维 表 , 表 的 一 行 对 应 一 个 元 组 ,一 列 对 应 
一 个 域 。 由 于 域 可 以 相同 ,为 了 加 以 区 分 ,为 每 列 起 一 个 名 字 , 称 为 属性 (Attribute)。 例 
如 , 表 2-2 就 是 一 个 关系 ,表示 了 小 说 人 物 对 照 关 系 。 
表 2-2 小 说 人 物 对 照 表 


姓 名 性 别 小 说 名 
唐 僧 男 西游 记 
s 宁 江 男 水 游 传 
林 仿 玉 女 红楼 梦 


通过 这 个 例子 可 以 看 出 ,对 于 一 个 笛 卡 儿 积 一 般 只 有 取 它 的 子 集 才 有 意义 ,这 和 用 户 看 
到 的 二 维 表 一 样 ,只 有 满足 一 定 条 件 的 二 维 表 才 是 研究 的 对 象 。 

表 2-3 是 一 张 学 生 表 , 它 是 一 张 二 维 表格 , 且 是 一 个 关系 ,是 由 学 生 学 号 、 姓 名 、 性 别 、 专 
业 、 出 生年 份 5 个 域 计 算 笛 卡 儿 积 后 得 到 的 学 生 信息 表 。 


表 2-3 学 生 表 

学 生 学 号 姓 名 性 别 专 业 出 生年 份 
09150123 张 建 男 信息 安全 1997 
10150038 刘 英 女 法 学 1996 
11150016 孙 剑 宾 男 会 计 学 1996 
12150239 任 英杰 男 建筑 学 1998 
13150363 范 伟 男 统计 学 1997 
4. 人 码 


在 关系 数据 库 中 , 码 是 关系 模型 的 一 个 重要 概念 。 码 由 一 个 或 几 个 属性 组 成 ,在 实际 应 
用 中 ,有 如 下 几 种 码 。 

(1) 候选 码 (Candidate Key) : 在 一 个 关系 中 ,能 唯一 标识 元 组 的 属性 或 最 小 属性 集 称 
为 关系 的 候选 码 。 

(2) 主 码 (Primary Key): 若 一 个 关系 中 有 多 个 候选 码 , 则 选 其 中 一 个 作为 主 码 。 包 含 
在 任何 一 个 候选 码 中 的 属性 称 为 主 属性 (Primary Attribute) ,不 包含 在 任何 候选 码 中 的 属 
性 称 为 非 主 属性 (Non-primary Attribute) 或 非 码 属性 (Non-key Attribute) 。 

在 表 2-3 的 关系 中 ,通过 “学 生 学 号 ”能 唯一 标识 学 生 , 因 而 “学 生 学 号 ”是 一 个 候选 码 。 
另外 ,假设 学 生 中 没有 姓名 重复 ,那么 “姓名 ”也 可 以 作为 一 个 候选 码 。 关 系 的 候选 码 可 以 有 
多 个 ,但 针对 实际 问题 只 能 指定 一 个 作为 主 码 。 

(3) 外 码 (Foreign Key): 设 下 是 基本 关系 R 的 一 个 或 一 组 属性 ,但 不 是 R 的 码 。K, 是 
基本 关系 S 的 主 码 。 如 果 下 与 K. 相 对 应 , 则 称 下 是 R 的 外 码 , 并 称 基本 关系 R 为 参照 关系 


(Referencing Relation) ,基本 关系 S 为 被 参照 关系 (Referenced Relation ) 。 

例如 ,学 生 关 系 和 专业 关系 分 别 为 : 

学 生 ( 学 生 学 号 ,姓名 ,性 别 ,出 生年 份 ,专业 编号 ,身份 证 号 码 ) 

专业 (专业 编号 ,专业 名 称 ,专业 负责 人 ) 

学 生 表 的 主 码 为 “学 生 学 号 ”, 专 业 表 的 主 码 为 “专业 编号 ”, 在 学 生 表 中 “专业 编号 ”这 一 
属性 不 能 任意 取 值 ,必须 参照 专业 表 中 存在 的 专业 来 取 , 因 此 称 “ 专 业 编 号 ”是 学 生 表 的 外 
码 。 同 时 ,“ 专 业 编号 "作为 专业 表 的 主 码 和 学 生 表 的 外 码 , 可 以 实现 两 个 表 的 关联 , 即 当 需 
要 查询 “ 某 个 学 生 所 在 的 专业 信息 ”时 ,可 以 通过 “专业 编号 ”将 学 生 表 和 专业 表 进 行 连接 ,从 
而 完成 该 查询 请 求 。 在 关系 数据 库 中 , 表 与 表 的 联系 就 是 通过 公共 属性 实现 的 ,这 个 公共 属 
性 是 一 个 表 的 主 码 和 另外 一 个 表 的 外 码 。 

5. 关系 的 性 质 

尽管 关系 与 二 维 表 ,传统 的 数据 文件 有 相似 之 处 ,但 它们 又 有 区 别 。 严 格 地 说 ,关系 是 
一 种 规范 化 的 二 维 表 ,具有 如 下 性 质 。 

(1) 分 量 必须 取 原 子 值 , 即 每 一 个 分 量 都 必须 是 不 可 分 的 数据 项 。 

(2) 列 是 同 质 的 , 即 每 一 列 中 的 分 量 是 同一 类 型 的 数据 ,来 自 同一 个 域 。 列 的 取 值 范围 
称 为 域 , 同 列 具有 相同 的 域 ,不 同 的 列 也 可 以 具有 相同 的 域 。 例 如 ,性 别 的 值 域 是 { 男 , 女 }; 
年 龄 的 值 域 是 整数 。 

(3) 表 中 的 列 称 为 属性 ,给 每 列 起 一 个 名 称 即 属性 名 ,不 同属 性 要 起 不 同 的 属性 名 。 

(4) 列 的 顺序 无 关 , 即 列 的 顺序 可 以 任意 交换 。 但 是 有 时 为 了 方便 ,使 用 时 有 列 序 。 

(5) 关系 中 任意 两 行 (元 组 ) 不 能 相同 。 但 是 在 大 多 数 的 关系 数据 库 产 品 中 ,如 果 用 户 
没有 定义 有 关 约 束 条 件 , 则 允许 关系 表 中 存在 两 个 完全 相同 的 元 组 。 

(6) 行 的 顺序 无 关 , 即 行 的 顺序 可 以 任意 交换 。 

以 上 6 个 性 质 可 以 简单 归纳 为 : 关系 中 的 每 一 个 属性 是 不 可 分 解 的 , 即 所 有 域 都 应 是 
原子 数据 的 集合 ; 没有 完全 相同 的 行 和 列 ,行列 的 排列 顺序 是 无 关 紧 要 的 。 


2.1.2 关系 操作 


关系 数据 模型 提供 了 一 系列 操作 的 定义 ,这 些 操作 称 为 关系 操作 ,关系 操作 的 特点 是 集 
合 操作 方式 , 即 操作 的 对 象 和 结果 都 是 集合 。 

关系 操作 一 般 可 分 为 两 类 : 一 类 是 关系 检索 操作 , 另 一 类 是 关系 更 新 操作 。 更 新 操作 
又 分 为 插入 、 删 除 和 修改 。 进 行 更 新 操作 时 ,不 应 该 破坏 在 关系 模式 上 指定 的 完整 性 约束 。 
关系 数据 库 管 理 系统 一 般 向 用 户 提供 如 下 4 种 基本 数据 操纵 功能 。 

(1) 数据 检索 。 数 据 检 索 是 查找 出 用 户 想 要 的 数据 。 这 个 查找 是 按照 用 户 指定 的 条 件 
进行 的 , 它 可 以 是 一 个 关系 内 的 数据 ,也 可 以 是 多 个 关系 间 的 数据 。 对 一 个 关系 内 数据 的 检 
索 主 要 是 选择 一 些 指定 的 属性 ( 列 的 指定 ) 或 选择 满足 某 些 逻辑 条 件 的 元 组 ( 行 的 选择 ) 。 而 
对 多 个 关系 间 数 据 的 检索 可 以 分 解 为 : 先 将 多 个 关系 合并 成 一 个 大 关系 ,然后 检索 合并 后 
的 关系 。 因 此 ,数据 检索 可 包含 三 个 基本 操作 : 四 一 个 关系 内 属性 的 指定 ; 四 一 个 关系 内 
元 组 的 指定 ; @ 两 个 关系 的 合并 。 

(2) 数据 插入 。 在 一 个 关系 内 插入 一 个 或 一 些 新 的 元 组 。 

(3) 数据 删除 。 在 关系 内 删除 一 些 元 组 。 
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(4) 数据 修改 。 用 于 改变 已 存在 的 元 组 中 的 一 些 属 性 的 值 。 该 操作 实际 上 可 分 解 为 两 
个 更 基本 的 操作 : 先 删除 要 修改 的 元 组 ,再 将 包含 新 值 的 元 组 插入 。 

上 述 4 类 数据 操纵 的 对 象 都 是 关系 ,这 样 , 对 关系 模型 的 数据 操纵 可 描述 如 下 。 

(1) 操纵 对 象 是 关系 。 

(2) 基本 操纵 方式 有 如 下 5 种 。 

@ 属性 指定 ,指定 一 个 关系 的 某 些 属性 ,确定 二 维 表 中 的 列 。 主 要 用 于 检索 或 定位 。 

@ 元 组 选择 ,用 一 个 逻辑 表达 式 给 出 一 个 关系 中 满足 此 条 件 的 那些 元 组 ,确定 二 维 表 
中 的 行 。 主 要 用 于 检索 或 定位 。 

@ 关系 合并 ,将 两 个 关系 合并 成 一 个 关系 。 用 以 合并 多 张 表 ,从 而 实现 多 张 表 间 的 检 
索 和 定位 。 

@ 元 组 插入 ,在 一 个 关系 中 添加 一 些 元 组 。 用 以 完成 数据 插入 或 修改 。 

@ 元 组 删除 , 先 确定 所 要 删除 的 元 组 ,然后 将 它们 删除 。 用 于 数据 删除 或 修改 。 

早期 的 关系 操纵 能 力 通常 通过 代数 方式 或 逻辑 方式 表示 ,分别 为 关系 代数 和 关系 演算 。 
关系 代数 是 用 对 关系 的 运算 来 说 明 查 询 要 求 的 方式 。 而 关系 演算 是 用 谓词 来 表达 查询 要 求 
的 方式 。 关 系 演算 又 可 分 为 元 组 关系 演算 和 域 关系 演算 两 种 。 关 系 代数 ,元 组 关系 演算 和 
域 关系 演算 都 是 抽象 的 查询 语言 ,在 表达 能 力 上 是 完全 等 价 的 ,这 些 抽 象 的 语言 与 具体 的 数 
据 库 管 理 系统 中 实现 的 实际 语言 不 完全 相同 ,实际 的 查询 语言 除了 提供 关系 代数 或 关系 演 
算 的 功能 外 ,还 提供 了 许多 附加 功能 ,如 算术 运算 、 聚 集 函 数 等 。 

除 关系 代数 和 关系 演算 语言 之 外 ,关系 数据 库 标 准 语言 SQL (Structured Query 
Language, 结 构 化 查询 语言 ) 是 介 于 关系 代数 和 关系 演算 之 间 的 一 种 语言 。SQL 不 仅 具 有 
丰富 的 查询 功能 ,而 且 具 有 数据 定义 功能 数据 操 纵 功 能 、 数 据 控制 功能 。 这 些 功 能 被 集成 
到 一 个 语言 系统 中 ,只 要 用 SQL 就 可 以 实现 数据 库 生 命 周期 中 的 全 部 活动 。 

关系 数据 诸 言 是 一 种 高 度 非 过 程 化 的 语言 ,用 户 不 必 请 求 数据 库 管 理 员 来 为 其 建立 特 
定 的 存 取 路 径 , 存 取 路 径 的 选择 由 DBMS 的 优化 机 制 来 完成 ,用 户 只 要 告诉 系统 做 什么 ,就 
可 以 完成 数据 操作 。 图 2-1 列 出 了 关系 数据 语言 的 分 类 。 

关系 代数 语言 例如 : ISBL 
Be 、 、( 元 组 关系 演算 语言 例如 : APLHA,QUEL 
关系 数据 语言 关系 演算 语言 | 站 关 系 演 筑 语言 
具有 关系 代数 和 关系 演算 双重 特点 的 语言 。 例如 : SQL 


2-1 关系 数据 语言 的 分 类 


2.1.3 关系 完整 性 约束 


完整 性 约束 是 利用 完整 性 规则 对 关系 进行 约束 的 一 些 条 件 。 关 系 模型 提供 了 丰富 的 完 
整 性 控制 机 制 ,包括 实体 完整 性 ,参照 完 整 性 和 用 户 定义 完整 性 三 类 完整 性 规则 。 其 中 , 实 
体 完 整 性 和 参照 完整 性 是 关系 模型 必须 满足 的 完整 性 的 约束 条 件 , 被 称 作 关 系 的 两 个 不 变 
性 ,应 该 由 关系 系统 自动 支持 。 

1. 实体 完整 性 规则 

若 属 性 A 是 基本 关系 R 的 主 属性 , 则 属性 A 不 能 取 空 值 。 


该 规则 要 求 关 系 在 主 码 上 的 属性 不 能 取 空 值 。 所 谓 空 值 就 是 “不 知道 ”或 “无 意义 ”的 
值 。 如 果 出 现 空 值 ,那么 主 码 就 失去 了 对 实体 的 标识 作用 , 即 不 能 唯一 标识 关系 中 的 元 组 。 
例如 , 表 2-4 和 表 2-5 分 别 给 出 了 导师 表 和 研究 生 表 。 


表 2-4 导师 表 
导师 编号 姓 名 性 别 职 称 
102 孟 雪 女 副教授 
115 赵 名 威 男 副教授 
159 海 闲 男 教 授 
表 2-5 研究 生 表 
研究 生 学 号 姓 名 性 别 研究 方向 导师 编号 
200112 方 力 为 男 计算 机 应 用 115 
200145 刘 若 非 女 软件 159 
200116 梁 信 伟 男 通信 189 
200152 韩 小 亭 去 软件 159 
200153 王 刚 男 网 络 


导师 表 的 主 码 是 导师 编号 ,研究 生 表 的 主 码 是 研究 生 学 号 。 这 两 个 主 码 的 值 在 表 中 是 
唯一 的 ,确定 的 ,只 有 这 样 才 能 有 效 标识 每 一 个 导师 和 研究 生 。 根 据 实体 完整 性 要 求 , 主 码 
值 不 能 为 空 (NULL) ,因为 空 值 无 法 标识 和 区 分 表 中 的 任意 一 行 。 为 了 保证 主 码 对 实体 的 
标识 作用 ,必须 要 求 主 码 不 能 取 空 值 。 

说 明 

(1) 在 导师 表 中 ,导师 编号 不 允许 是 重复 值 和 空 值 ,而 在 研究 生 表 中 导师 编号 可 以 是 空 
值 ,也 可 以 重复 ,因为 研究 生 表 中 导师 编号 不 是 主 码 ,所 以 不 受 实体 完整 性 规则 的 约束 。 

(2) 实体 完整 性 规则 规定 关系 在 主 码 上 的 所 有 属性 都 不 能 取 空 值 ,而 不 仅 是 主 码 整体 
不 能 取 空 值 。 例 如 ,有 一 个 关系 RCU1,U2,U3,U4,U5), 其 中 , (Ul1,U2) 为 主 码 , 则 Ul 和 
U2 两 个 属性 都 不 能 取 空 值 。 

2. 参照 完整 性 规则 

车 属性 (或 属性 组 )F 是 基本 关系 R 的 外 码 , 它 与 基本 关系 S 的 主 码 Ks 相对 应 (基本 关 
系 R 和 S 不 一 定 是 不 同 的 关系 ), 则 对 于 R 中 每 个 元 组 在 F 上 的 值 必须 为 : 

(1) 或 者 取 空 值 (F 的 每 个 属性 值 均 为 空 值 ) 。 

(2) 或 者 等 于 S 中 某 个 元 组 的 主 码 值 。 

这 条 规则 实质 上 就 是 “不 允许 引用 一 个 不 存在 的 实体 "。 如 前 面 所 述 , 在 关系 数据 库 中 ， 
关系 与 关系 的 联系 是 通过 公共 属性 实现 的 ,这 个 公共 属性 就 是 一 个 表 的 主 码 和 另 一 个 表 的 
外 码 ,而 参照 完整 性 规则 就 是 对 外 码 取 值 的 约束 , 即 外 码 必须 是 被 参照 关系 中 主 码 的 有 效 
值 ,或 者 是 一 个 “ 空 值 ”。 

例如 , 表 2-4 和 表 2-5 中 ,两 个 表 之 间 的 联系 就 是 通过 导师 编号 实现 的 ,导师 编号 是 导 
师表 的 主 码 ,研究 生 表 的 外 码 。 研 究 生 表 中 的 导师 编号 必须 是 导师 表 中 导师 编号 的 有 效 值 ， 
或 者 取 “ 空 值 ”, 反 之 ,就 是 非法 的 数据 。 如 果 研 究 生 表 中 的 导师 编号 是 “ 空 值 ”, 则 表示 该 研 
究 生 还 没有 被 分 配 导 师 。 如 果 研 究 生 表 中 的 导师 编号 是 导师 表 中 导师 编号 的 有 效 值 , 则 表 
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示 该 研究 生 的 导师 是 谁 。 在 表 2-5 中 ,学 号 为 *200153” 的 学 生 没有 固定 的 导师 ,所 以 他 的 导 
师 编 号 为 “ 空 值 ”; 而 学 号 为 *200116” 的 学 生 的 导师 编号 为 189, 就 是 一 个 非法 值 ,因为 这 个 
值 在 导师 表 中 不 存在 。 

3. 用 户 定义 完整 性 规则 

这 是 针对 某 一 具体 数据 的 约束 条 件 ,由 具体 环境 决定 。 它 反映 某 一 具体 应 用 所 涉及 的 
数据 必须 满足 的 语义 要 求 。 系 统 应 提供 定义 和 检验 这 类 完整 性 的 机 制 ,以 便 用 统一 的 系统 
方法 处 理 它们 ,而 不 再 由 应 用 程序 承担 这 项 工作 。 例 如 学 生成 绩 应 该 大 于 或 等 于 零 ,职工 的 
工龄 应 小 于 年 龄 ,人 的 身高 不 能 超过 3m 等 。 

4. 举例 

对 于 在 实际 操作 中 关系 完整 性 约束 的 体现 可 以 用 一 些 例子 来 进行 说 明 。 下 面 以 本 节 中 
的 表 2-4 和 表 2-5 为 例 。 

(1) 在 表 2-4 中 插入 {null, 章 岚 , 女 , 副 教授 }。 

这 个 插入 操作 破坏 了 实体 完整 性 约束 ( 主 码 “ 导 师 编号 ”为 空 值 ) ,因此 该 操作 被 拒绝 。 

(2) 在 表 2-4 中 插入 {177, 章 岚 , 女 , 副 教授 }。 

这 个 插入 操作 满足 所 有 的 约束 ,所 以 被 接受 执行 。 

(3) 在 表 2-5 中 删除 {200112, 方 力 为 , 男 ,计算 机 应 用 ,115})。 

这 个 操作 可 以 被 接受 执行 。 

(4) 在 表 2-4 中 删除 {115, 赵 名 威 , 男 ,副教授 }。 

这 个 操作 不 被 接受 ,因为 在 表 2-5 中 的 记录 还 要 参照 这 个 元 组 。 

(5) 在 表 2-5 中 将 {200145, 刘 若非 , 女 ,软件 ,159} 更 新 为 {200145, 刘 若非 ,null, 软件， 
159) 。 

假设 用 户 定 义 了 “性 别 不 能 取 空 值 ”的 完整 性 规则 ,那么 这 个 操作 不 被 执行 。 


2.2 关系 代数 


关系 代数 是 处 理 关 系数 据 的 重要 数学 基础 之 一 ,是 关系 数据 操纵 语言 的 一 种 传统 表达 
方式 。 它 为 从 一 些 关系 生成 另 一 些 新 关系 提供 了 简单 而 又 非常 有 用 的 方法 ,许多 著名 的 关 
系数 据 库 语言 (如 SQL 等 ) 都 是 基于 关系 代数 开发 的 。 

在 关系 代数 中 ,用 户 对 关系 数据 的 操作 都 是 通过 关系 代数 表达 式 描述 的 ,任何 一 个 关系 
代数 表达 式 都 由 运算 符 和 作为 运算 分 量 的 关系 构成 。 关 系 代数 用 到 的 运算 符 包 括 4 类: 传 
统 的 集合 运算 符 专门 的 关系 运算 符 、 比 较 运 算 符 和 逻辑 运算 符 。 集 合 运算 包括 并 、 差 、 交 、 
第 卡 儿 积 ; 专门 的 关系 运算 包括 选择 .投影 .连接 和 除 运算 ; 比较 运算 符 包括 大 于 、 大 于 等 
于 、 小 于 、 小 于 等 于 、 等 于 ,不 等 于 ; 逻辑 运算 符 包括 与 .或 , 非 。 传 统 的 集合 运算 将 关系 看 成 
元 组 的 集合 ,其 运算 是 从 关系 行 角度 进行 的 ,专门 的 关系 运算 不 仅 涉 及 行 ,而 且 涉及 列 ,比较 
运算 符 和 逻辑 运算 符 是 用 来 辅助 关系 运算 符 进行 操作 的 。 


2.2.1 传统 的 集合 运算 


传统 的 集合 运算 包括 关系 的 并 、 交 、 差 和 笛 卡 儿 积 。 在 进行 关系 的 并 、 交 、 差 运算 时 , 假 
定 参与 运算 的 关系 R 和 S 具 有 相同 的 属性 个 数 n(R 和 S 同 为 n 目 关系 ), 相 应 的 属性 取 自 


同一 个 域 ,这 意味 着 R 和 S 具 有 相同 的 结构 , 称 它们 为 相 容 (或 同 构 ) 关 系 , 这 是 对 关系 进行 
并 \ 交 、 差 运算 的 前 提 条 件 。 
1. 并 运算 
所 谓 并 运算 (Union) 是 指 将 R 与 S 合并 为 一 个 关系 ,并 且 去 掉 重复 元 组 。 关 系 R 和 S 
的 并 运算 记 为 RUS。 
形式 化 定义 如 下 : 
RUS={tltERVtES} 
RUS 结果 仍然 是 一 个 nn 目 关 系 ,由 属于 RR 或 属于 S 的 元 组 组 成 。t 是 元 组 变量 ,R 和 S 
的 元 数 相同 。 图 2-2 中 阴影 部 分 表示 RUS 的 结果 。 并 运算 可 用 于 完成 元 组 插入 操作 。 
2. 差 运 算 
差 运 算 (Difference) 是 指 在 R 中 去 掉 S 中 存在 的 元 组 组 成 的 一 个 新 关系 。 
关系 R 和 S 的 差 记 为 R 一 S, 形 式 化 定义 如 下 : 
R—S={t|t€E RAt¢S} 
R 一 S 结果 仍然 是 一 个 nn 目 关系 ,由 属于 R 但 不 属于 S 的 元 组 组 成 。t 是 元 组 变量 ,R 
和 S 的 元 数 相同 。 
需要 注意 的 是 ,R 一 S 不同 于 S 一 R。 图 2-3 中 阴影 部 分 表示 R 一 S。 差 运算 可 用 于 完成 
对 元 组 的 删除 操作 。 
3. 交 运 算 
交 运 算 (Intersection) 是 指 在 R 中 找 出 与 S 中 相同 的 元 组 组 成 一 个 新 的 关系 。 
关系 R 和 S 的 交 运 算 记 为 Rs, 形式 定义 如 下 : 
RNS={t|tERAtES) 
RNMS 结果 还 是 一 个 n 目 关系 ,由 同时 属于 R 和 S 的 元 组 组 成 。t 是 元 组 变量 ,R 和 S 
的 元 数 相同 。 图 2-4 中 阴影 部 分 表示 RN 站 S。 关 系 的 交 运 算 可 以 用 差 运 算 来 表示 , 即 : 
RN 站 S=R 一 (R 一 9S) 或 者 R 站 S=S 一 (S 一 R)。 


人 人 ) (UL 


图 2-2 并 运算 图 2-3 差 运算 图 2-4 交 运 算 


4. 广义 笛 卡 儿 积 运算 

R 与 S 的 广义 笛 卡 儿 积 运算 (Cartesian Product) 是 用 R 中 的 每 个 元 组 与 S 中 每 个 元 组 
串 接 而 成 的 一 个 新 关系 。 新 关系 的 度 为 R 与 S 的 度 之 和 ,新 关系 的 基数 为 R 与 S 元 组 数 的 
乘积 。 

设 有 关系 R 和 S, 它 们 分 别 是 r 目 和 s 目 关系 ,并 且 分 别 有 p 和 9q 个 元 组 .关系 R、S 经 
广义 笛 卡 儿 积 运算 的 结果 本 是 一 个 r 十 s 目 关 系 ,共有 pXq 个 元 组 ,这 些 元 组 是 由 R 与 S 
的 元 组 组 合 而 成 的 。 关 系 R 与 S 的 广义 笛 卡 儿 积 运算 用 RXS 表示 ,形式 定义 如 下 : 
RXS={tt It ERAtES)} 

由 于 R 和 S 中 可 能 存在 相同 的 属性 名 ,在 RXS 构成 的 新 关系 中 ,不 允许 列 有 重 名 的 情况 ， 
因此 ,采用 “关系 .属性 名 ”的 方式 命名 RXS 中 的 同名 属性 。 
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下 面 就 以 表 2-6 和 表 2-7 中 的 两 个 表 R、S 为 例 说 明 上 述 几 种 运算 。 


表 2-6 关系 R 表 2-7 关系 S 
产品 名 产地 数量 产品 产地 数量 
内 存 河南 20 内 存 南京 18 
Re 内 存 上 海 18 
i Wn 光驱 上 海 19 
光驱 南京 20 光驱 南京 20 


表 2-8 一 表 2-11 分 别 为 RUS、RNS、R 一 S 和 RXS 的 结果 ,其 中 ,RUS 得 到 的 是 两 个 
关系 中 完全 不 同 的 5 条 记录 ,RNS 得 到 的 是 两 个 关系 中 相同 的 两 条 记录 ,R 一 S 得 到 的 是 在 
关系 R 中 去 掉 和 关系 S 中 相同 的 记录 ,RXS 得 到 的 是 R 和 S 两 个 关系 中 各 记录 的 组 合 , 共 
12 个 元 组 。 特 别 地 ,由 于 R 和 S 的 属性 名 称 相同 ,因此 在 笛 卡 儿 积 中 按照 “关系 .属性 名 ”的 


方式 重新 命名 。 
表 2-8 RUS 表 2-9 RNS 表 2-10 R 一 S 
产品 名 ”产地 数量 产品 名 ”产地 数量 产品 名 ”产地 数量 
内 存 河南 20 内 存 南京 18 内 存 河南 20 
内 存 南京 18 光驱 南京 20 
光驱 南京 20 
内 存 上 海 18 
光驱 上 海 19 
表 2-11 RXS 
R. 产品 名 R. 产地 R. 数量 S. 产品 名 S. 产地 S. 数量 
内 存 河南 20 内 存 南京 18 
内 存 河南 20 内 存 上 海 18 
内 存 河南 20 光驱 上 海 19 
内 存 河南 20 光驱 南京 20 
内 存 南京 18 内 存 南京 18 
内 存 南京 18 内 存 上 海 18 
内 存 南京 18 光驱 上 海 19 
内 存 南京 18 光驱 南京 20 
光驱 南京 20 内 存 南京 18 
光驱 南京 20 内 存 上 海 18 
光驱 南京 20 光驱 上 海 19 
光驱 南京 20 光驱 南京 20 


2.2.2 专门 的 关系 运算 


对 于 关系 数据 的 操作 ,有 些 无 法 用 传统 的 集合 运算 完成 。 例 如 ,元 组 的 选择 和 属性 的 指 
定 等 操作 ,需要 引入 一 些 新 的 运算 完成 特殊 的 关系 操作 要 求 。 专 门 的 关系 运算 包括 选择 、 投 


为 了 对 下 面 的 操作 进行 说 明 , 假 设 有 一 个 学 生成 绩 管 理 数据 库 , 该 数据 库 包 括 学 生 表 、 
课程 表 和 学 习 表 ,结构 如 表 2-12 一 表 2-14 所 示 。 


表 2-12 学 生 表 
学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 
091501 王 英 女 河北 1997 计算 机 
091502 王 小 梅 女 江苏 2000 言 电 
091503 张 小 飞 男 江西 1996 计算 机 
091504 孙 志 男 海南 1998 计算 机 
091505 徐 颖 女 江苏 1997 言 电 
091506 钱 易 蒙 男 河北 2000 外 文 
表 2-13 课程 表 
课程 号 课 程 名 学 时 开课 学 期 课程 性 质 
180101 数据 结构 56 2 必修 
180102 操作 系统 48 3 必修 
180103 数据 库 原理 48 4 必修 
表 2-14 学 习 表 
学 号 课 程 号 成 绩 
091501 180101 72 
091501 180102 88 
091501 180103 77 
091502 180101 70 
091502 180102 65 
091502 180103 70 
1. 选择 运算 


选择 是 指 在 给 定 的 关系 中 选择 出 满足 条 件 的 元 组 组 成 一 个 新 的 关系 。 

选择 运算 根据 某 些 条 件 对 关系 做 水 平分 割 , 即 选择 符合 条 件 的 元 组 ,因此 ,选择 运算 提 
供 了 一 种 从 水 平方 向 构造 一 个 新 关系 的 手段 ,如 图 2-5 所 示 。 

选择 运算 是 单 目 运算 ,运算 符 为 “o” ,条件 用 命题 公 
式 下 表示 ,F 中 的 运算 对 象 是 常量 (用 引号 括 起 来 ) 或 元 


组 分 量 ( 


属性 名 或 列 的 序号 ), 运 算 符 有 比较 运算 符 


(二 ,全 , 写 ,三 ,二 , 隆 , 这 些 符号 也 称 为 96 符 ) 和 侵 辑 运 


算 符 (人 ， 


Ms 


关系 及 关于 公式 下 的 选择 运算 用 or (R) 表 示 , 形 式 
化 定义 如 下 : 


图 2-5 选择 运算 示意 图 


or (R)={t|lt ERAF(t)= 'true'} 
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其 中 ,or(R) 表 示 从 R 中 挑选 满足 公式 下 的 元 组 所 构成 的 关系 。 
【 例 2-1】 查询 计算 机 学 院 全 体 学 生 情 况 。 
分 析 : 该 操作 要 进行 的 操作 对 象 为 学 生 表 ,选择 的 条 件 是 学 院 一 “计算 机 ”, 用 关系 代数 
表示 为 : 
Ga 学院 一 计算 机 《学 生 ) 


操作 结果 见 表 2-15 。 
表 2-15 例 2-1 操作 结果 


学 号 姓 名 性 “ 别 籍 贯 出 生年 份 学 院 
091501 王 英 页 河北 1997 计算 机 
091503 张 小 飞 男 江西 1996 计算 机 


091504 孙 志 鹏 男 海南 1998 计算 机 


【 例 2-2】 查询 20 世纪 90 年 代 出 生 的 全 体 学 生 情况 。 
分 析 : 该 操作 要 进行 的 操作 对 象 也 是 学 生 表 ,选择 的 条 件 是 出 生年 份 在 1990 一 1999 年 
之 间 , 用 关系 代数 表示 为 ; 
出 生年 份 > 一 1990A 出 生年 份 < 1999《 学 生 ) 


操作 结果 见 表 2-16 。 
表 2-16 ” 例 2-2 操作 结果 


学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 

091501 王 英 女 河北 1997 计算 机 

091503 张 小 飞 男 江西 1996 计算 机 

091504 孙 志 鹏 所 海南 1998 计算 机 
女 


091505 徐 颖 江苏 1997 言 电 
【 例 2-3】 查询 信 电 学 院 江 苏 籍 全 体 学 生 情 况 。 
分 析 : 该 操作 要 进行 的 操作 对 象 为 学 生 表 ,选择 的 条 件 是 学 院 一 “ 信 电 ”, 并 且 籍 贯 一 
“江苏 ”, 用 关系 代数 表示 为 : 
9 学 院 一 “ 信 电 ”人 籍贯 二 江苏 *( 学 生 ) 
操作 结果 如 表 2-17 所 示 。 
表 2-17 例 2-3 操作 结果 


学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 
091502 王 小 梅 女 江苏 2000 信和 电 


091505 徐 颖 女 江苏 1997 信和 电 


【 例 2-4】 查询 江苏 或 者 河北 全 体 学 生 情 况 。 
分 析 : 该 操作 要 进行 的 操作 对 象 为 学 生 表 ,选择 的 条 件 是 籍贯 为 江苏 或 者 河北 ,用 关系 
代数 表示 为 : 


0 着 员 一 “江苏 "V 夭 员 一 "河北 "(学 生 ) 


表 2-18 例 2-4 操作 结果 


学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 

091501 王 英 女 河北 1997 计算 机 

091502 王 小 梅 女 江苏 2000 信和 电 

091505 徐 颖 女 江苏 1997 信和 电 
男 2000 


091506 钱 易 蒙 河北 


外 文 


通过 上 述 几 个 例子 可 以 看 出 ,选择 运算 的 关键 是 明确 两 个 问题 DD 确定 所 要 操作 的 关 


系 ; @ 确 定 操 作 的 条 件 以 及 如 何 表示 。 

2. 投影 运算 

对 一 个 关系 内 属性 的 指定 称 为 投影 运算 , 它 也 是 单 目 运 
算 。 这 个 操作 是 对 一 个 关系 进行 垂直 分 割 ,消去 某 些 列 , 并 按 
要 求 的 顺序 重新 排列 ,再 删 去 重复 元 组 。 投影 运 算 提供 了 一 
种 从 垂直 方向 构造 一 个 新 关系 的 手段 ,如 图 2-6 所 示 。 

关系 R 关于 属性 集 A 的 投影 运算 用 [| 、(R) 表示 ,形式 
化 定义 如 下 : 

Tl,R) = {AJ Ite R) 
【 例 2-5】 查询 所 有 学 生 的 姓名 和 籍贯 。 


SS 
~ 
、 
| 


图 2-6 投影 运算 示意 图 


分 析 : 该 操作 要 进行 的 操作 对 象 为 学 生 表 , 所 关心 的 属性 只 有 姓名 和 籍贯 ,用 关系 代数 


表示 为 : 
J smn (学 生 ) 或 者 本 ,, (学生) ,属性 名 可 用 列 号 来 表示 。 
操作 结果 见 表 2-19。 
【 例 2-6】 查询 学 生来 自 哪些 省 份 。 


分 析 : 该 操作 初 看 起 来 不 知道 如 何 下 手 , 但 实际 上 要 进行 的 操作 对 象 为 学 生 表 , 所 关心 


的 属性 是 籍贯 ,所 以 用 关系 代数 表示 如 下 ， 
IT wn (学 生 ) 


操作 结果 见 表 2-20。 
表 2-19 例 2-5 操作 结果 
姓 名 籍贯 姓 名 籍贯 


表 2-20 例 2-6 操作 结果 


籍贯 


河北 
江苏 
江西 
海南 
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通过 上 述 两 个 投影 的 例子 可 以 看 出 ,投影 之 后 不 仅 取消 了 原 关 系 中 的 某 些 列 ,而 且 取消 
了 某 些 元 组 ,原因 是 取消 了 某 些 属性 列 后 ,会 出 现 一些 完 全 相同 的 行 ,根据 关系 的 性 质 ,应 取 
消 这 些 重 复 的 行 。 

有 了 选择 和 投影 运算 ,可 以 方便 地 对 一 个 关系 内 任意 行 、 列 的 数据 进行 查找 。 

【 例 2-7】 查找 出 生年 份 在 1998 年 以 前 (不 含 1998 年 ) 的 学 生 的 姓名 、 籍 贯 及 其 出 生年 
份 情况 。 

查询 表达 式 如 下 : 

I se.wm.asse (cues (A 生 )) 
操作 结果 见 表 2-21。 
表 2-21 例 2-7 操作 结果 


姓 名 籍 贯 出 生年 份 

王 英 河北 1997 

张 小 飞 江西 1996 

徐 颖 江苏 1997 
3. 连接 运算 


连接 运算 是 把 两 个 关系 连接 成 一 个 新 关系 , 它 是 一 个 双 目 运算 。 
假设 有 两 个 关系 R 和 S,R 和 S 的 连接 是 指 在 R 与 S 的 笛 卡 儿 积 中 ,选取 R 中 的 属性 
组 A 的 值 与 S 中 的 属性 组 B 的 值 进行 比较 后 , 找 出 满足 比较 关系 的 元 组 ,组 成 一 个 新 的 关 
系 。 连 接 操 作 可 以 记 作 : 
RPEAS={tt, lt E RAt, ESAtLALB]} 
其 中 ,A 和 B 分 别 为 R 和 S 上 度数 相等 且 可 比 的 属性 组 .9 是 比较 运算 符 , 因 此 ,也 称 连接 
为 0 连接 。 
当 为 “二 ”时 的 连接 运算 称 为 等 值 连接 ,等 值 连接 可 记 为 : 
R PM S={tt, It ERAt.ESAtLAJ=+[LBJ} 
具体 计算 过 程 如 下 : 计算 RXS; @ 找 出 RXS 中 满足 R 中 属性 A 的 值 与 S 中 属性 B 
的 值 相等 的 那些 元 组 。 
【 例 2-8】 假设 有 两 个 关系 R,S, 分 别 由 表 2-22 和 表 2-23 所 示 , 求 Rb S。 


表 2-22 关系 了 表 2-23 关系 S 
A B C B E 
a bi 5 b 
b: 
6 
a bs bs 10 


首先 ,计算 RXS, 结 果 见 表 2-24。 


的 


表 2-24 RXS 
A R.B © S.B E 
a b 5 bi 3 
al bi a b; % 
an b a b; 10 
a b 5 b, 2 
a bz 6 bi 3 
al b; 6 b; ks 
al bz 6 bs 10 
al bz 6 b, 2 
az2 bs 8 bi 3 
az bs 8 bs 7 
a bs 8 b; 10 
a bs 8 bs 2 
然后 , 找 出 满足 R.C 二 S.E 的 元 组 ,操作 结果 见 表 2-25 。 
表 2-25 R.C<S.E 
A R.B © S.B E 
al b 5 b; 7 
al bi bs 10 
al bz 6 b; b 
a b; 6 b; 10 
az bs 8 b; 10 
【 例 2-9】 以 例 2-8 中 的 两 个 关系 R,S 为 例 , 求 RM,S. 
在 RXS 的 基础 上 , 找 出 满足 R. B=S.B 条 件 的 元 组 ,操作 结果 见 表 2-26。 
表 2-26 R.B=S.B 
A R.B © S.B E 
an b bi 3 
al bz 6 b; 如 
az bs bs 10 
4. 自然 连接 


自然 连接 和 等 值 连接 一 样 ,都 是 连接 运算 的 特殊 情况 ,但 是 自然 连接 是 一 种 更 常用 和 有 
意义 的 连接 , 它 要 求 两 个 关系 中 进行 比较 的 分 量 必须 是 相同 的 属性 组 ,并 且 在 结果 中 把 重复 


属性 列 去 掉 。 如 果 关 系 R 和 S 具 有 相同 的 
RMS={tt,|t: ERA 
具体 计算 过 程 如 下 所 述 。 
(1) 计算 RxS。 


属性 组 B, 则 自然 连接 可 记 为 : 
t:ESNMt[B]=t[LB] } 


(2) 设 R 和 S 的 公共 属性 是 B, 则 找 出 RXS 中 满足 R 中 属性 B 的 值 与 S 中 的 属性 B 


关系 数据 府 


第 
2 
章 


数据 亩 原理 与 应 用 (MySQL 版 ) 


的 值 相 等 的 那些 元 组 。 
(3) 去 掉 S 中 B 列 (或 者 去 掉 R 中 B 列 )。 
【 例 2-10】 以 例 2-8 中 的 两 个 关系 R,S 为 例 , 求 RPIS。 
分 析 : (1) 第 一 步 ,计算 RXS, 结 果 见 例 2-8。 
(2) 第 二 步 , 计 算 满 足 R. B==S. B 条 件 的 元 组 ,结果 见 例 2-9。 
(3) 第 三 步 ,去 掉 重 复 列 ,操作 结果 见 表 2-27。 


表 2-27 RMXS 
A B C E 
a b 5 3 
al b; 6 ”7 
az b; 8 10 
【 例 2-11】 求 表 2-28 中 关系 SC 和 表 2-29 中 关系 C 的 自然 连接 。 
表 2-28 关系 SC 表 2-29 关系 C 
SNO CNO GRADE CNO CNAME CDEPT TNAME 
S3 C3 87 C2 离散 数学 计算 机 汪 宏 伟 
Sl C2 88 C3 高 等 数学 通信 钱 红 
S4 C3 79 C4 数据 结构 计算 机 马 和 良 
S9 C4 83 Gl 计算 机 原理 。 计算 机 李 兵 
分 析 : 第 一 步 ,计算 SCXC。 
第 二 步 , 计 算 满足 SC. CNO=C. CNO 条 件 的 元 组 。 
第 三 步 , 去 掉 重复 列 , 操 作 结果 如 表 2-30 所 示 。 
表 2-30 SCIXC 
SNO CNO GRADE CNAME CDEPT TNAME 
S3 C3 87 高 等 数学 通信 钱 红 
Sl C2 88 离散 数学 计算 机 汪 宏 伟 
S4 C3 79 高 等 数学 通信 钱 红 
S9 C4 83 数据 结构 计算 机 马 良 


通过 上 述 可 以 发 现 , 等 值 连接 和 自然 连接 两 者 是 有 区 别 的 ,二 者 的 不 同 点 如 下 所 述 。 

(1) 等 值 连接 要 求 相 等 的 分 量 ,但 不 一 定 是 公共 属性 ,而 自然 连接 要 求 相 等 的 分 量 必须 
是 公共 属性 。 

(2) 等 值 连接 不 做 投影 运算 ,而 自然 连接 要 把 重复 的 属性 去 掉 。 

(3) 自然 连接 一 定 是 等 值 连接 ,但 等 值 连接 不 一 定 是 自然 连接 。 

5. 除 运算 

除 运 算 适 用 的 场合 : 查询 条 件 是 一 个 集合 包含 另 一 个 集合 , 即 适 合 于 含有 短 请 “对 所 有 
的 ”的 查询 ,如 “查询 被 所 有 的 学 生 都 选修 的 课程 的 信息 ”。 

除 运算 的 条 件 : 假设 给 定 关系 R(X,Y) 和 SC(Y,Z)。R 和 S 中 的 Y 可 以 有 不 同 的 属性 
名 ,但 必须 出 自 相 同 的 域 集 。 


除 运算 的 结果 : R 与 S 的 除 运 算得 到 一 个 新 的 关系 PC(X),P 是 R 中 满足 下 列 条 件 的 元 
组 在 X 属性 列 上 的 投影 : 元 组 在 X 上 分 量 值 x 的 像 集 Y,, 包 含 S 在 Y 上 投影 的 集合 。 
记 作 ，: 

RS={t[X]|tERA Il,‘S ce | 
其 中 ,Y; 为 x 在 R 中 的 像 集 , 像 集 Yx=={t[Y]|t€R,t[X]==x}。 
【 例 2-12〗 关系 R 和 S 结构 见 表 2-31 和 表 2-32, 计 算 RS。 


表 2-31 关系 及 表 2-32 关系 S 
A B B 
Ai 了 B B, 
Ai 了 B。 B。 
A: B, B; 
A: 了 B。 
A: 了 Bs 
As B; 


分 析 : (1) 第 一 步 ,属性 B 是 关系 R 和 关系 S 的 公共 属性 ,因此 ,RS 的 结果 应 该 是 满 
足 条 件 的 R 中 的 元 组 在 属性 A 上 的 投影 。 
(2) 第 二 步 ,计算 | ,(S) ,结果 为 (Bl ,B ,Bs)。 


计算 [[ CR) = {A,,A:,As) 。 

Q@ 计算 Y.,BA, 二 {Bi,B:},Ba,={Bi,B,,B;},Ba, ={B;}. 

(3) 第 四 步 : 确定 满足 条 件 [[ ,CS) SY 的 元 组 , 即 ((As,B),(As,B,),(As ,Bs)), 这 
些 元 组 在 属性 A 上 的 投影 为 {A:} ,因此 ,RS 一 (As:)。 

除 运算 不 是 一 个 基本 运算 , 它 的 计算 过 程 可 以 用 基本 关系 运算 表示 如 下 。 

RS 

其 中 ,r 表示 关系 R 中 属性 的 个 数 ,s 表示 关系 S 中 属性 的 个 数 。 运 用 例 2-12 中 的 关系 
R 和 S 对 上 述 过 程 进行 描述 如 下 。 

分 析 : 

@ 计算 T= [][,,.,,(R) ,结果 = {Ai,As,As}。 

@ 计算 W 一 (TXS) 一 R, 结 果 W = {AliB; .AsB.,A;B,}。 

四 计算 V= [[,,.,,(W) ,结果 = {Ali,A;})。 

@ 计 算 T 一 V={As}。 

从 以 上 过 程 可 以 看 出 , 除 运算 的 实质 是 : 求 RCX,Y) 中 所 有 与 工 ,(S) 发 生 笛 卡 儿 积 运 
算 的 元 组 在 X 上 的 投影 ,因此 可 以 说 除 运算 (二 ) 是 笛 卡 儿 积 运算 (X ) 的 道 运算 。 

【 例 2-13】 假设 用 表 2-33 中 关系 S_C 表示 学 生 选 修 课程 的 情况 , 表 2-34 中 关系 C 给 
出 了 所 有 课程 号 , 试 找 出 选修 了 全 部 课程 的 学 生 的 学 号 。 

对 这 个 问题 可 用 除法 解决 , 即 (S_C) =C, 结 果 如 表 2-35 中 (S_C) =C 所 示 , 即 只 有 S2 
选修 了 全 部 课程 。 
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结合 上 面 的 例子 , 除 运算 的 计算 过 程 如 下 。 

(1) 第 一 步 : 根据 公式 T= 了 1.2..…,,_,(R) ,T= 二 1ys (S_C) 二 {Sl1,S2,S3}。 该 步 求 出 所 
有 参与 选课 的 学 生 学 号 。 

(2) 第 二 步 : 计算 W=(TXS) 一 R, 其 中 ,TXS={Sl1,S2,S3)} X {Cl,C2,C3), 得 到 所 
有 学 生 选 修 全 部 课程 的 选课 记录 。W 的 计算 结果 如 表 2-36 所 示 ,结果 表示 学 生 未 选修 课程 
的 记录 。 


表 2-33 SC 表 2-34 C 表 2-35 (S_C) 二 C 表 2-36 W 
学 生 学 号 ”课程 号 课程 号 学 生 学 号 学 生 学 号 ”课程 号 
sl Cl ci S2 Sl C3 
Sl B22 = S3 6L 
S2 Cl 站 S3 C3 
S2 C2 C3 

S2 5 
S3 C2 


(3) 第 三 步 , V = 本 ,，,.，,CW) ,计算 结果 为 V = [[ %s CW) = {S1,S3)。 

结果 表明 实际 没有 选修 全 部 课程 的 学 生 学 号 。 

(4) 第 四 步 : RS=T 一 V 计算 结果 为 R 二 S=T 一 V={S1,S2,S3} 一 {S1,S3} 一 {S2) 。 

结果 表示 参与 选课 的 学 生 中 选修 了 所 有 课程 的 学 生 学 号 ,此 结果 即 为 除 运算 的 结果 ,如 
表 2-35 所 示 。 

以 上 介绍 了 关系 代数 中 几 种 常见 并 且 比 较 重 要 的 运算 和 操作 ,这 些 运算 中 ,并 、 差 、 笛 卡 
儿 积 .选择 和 投影 运算 是 关系 代数 的 5 种 基本 运算 ,选择 和 投影 运算 为 单 目 运算 ,其 他 均 为 
双 目 运算 。 表 2-37 列 出 了 它们 的 主要 特征 和 区 别 。 

表 2-37 关系 代数 的 9 种 运算 比较 


运 算 单 / 双 目 基本 运算 复合 运算 表示 方法 
并 双 可 RUS 
差 双 - RS 
交 双 差 RNS 
笛 卡 儿 积 双 a RxS 
选择 音 到 or (R) 
投影 单 ~ 11 
连接 双 笛 卡 儿 积 .选择 RMS 
自然 连接 双 笛 卡 儿 积 选择. 投影 RWS 
除 双 笛 卡 儿 积 .投影 \ 差 RS 


2.2.3 关系 代数 举例 


下 面 以 表 2-12 一 表 2-14 为 例 说 明 如 何 通过 关系 代数 查询 表达 式 检索 数据 。 
【 例 2-14】 查询 计算 机 学 院 女 学 生 的 名 单 。 
分 析 : 首先 ,在 学 生 表 中 选择 “学 院 ” 为 计算 机 “性 别 ” 为 女 的 记录 ,然后 在 选择 的 结果 


上 对 姓名 进行 投影 ,得 到 的 关系 代数 表达 式 是 : 
(csm=--arwarAta- 当 (学 生 )) 
也 可 以 表示 为 : 
TI gs Cosmin- (学 生 ) 站 ous=" 妇 "(学 生 )) 
【 例 2-15】 查询 选修 180101 号 课程 的 学 生 姓名 。 
分 析 : 该 查询 涉及 的 操作 包括 : 选择 “课程 号 ”为 180101 的 元 组 和 投影 学 生 “ 姓 名 ”, 由 
于 这 两 种 运算 操作 的 对 象 分 别 在 学 习 表 和 学 生 表 中 ,所 以 还 要 进行 连接 运算 ,关系 代数 表达 
式 是 : 
Ws (Ga 课 姓 号 -180l0l" (学习 44 学生)) 
也 可 以 表示 为 : 
Ts (学 生 M4 owas-"oor (学 习 )) 
【 例 2-16】 查询 同时 选修 数据 库 及 数学 的 学 生 名 单 。 
分 析 : 该 查询 可 以 运用 除法 或 交 运 算 实 现 。 应 用 除法 时 ,首先 确定 除数 : 投影 出 数据 
库 和 数学 这 两 门 课 的 “课程 号 ”; 然后 确定 被 除数 : 在 选课 和 学 生 表 上 投影 出 “姓名 ”和 *“ 课 
程 号 ”; 最 后 运用 除法 得 到 的 结果 为 : 
i 4 学生) 二 | a (Ga 课 程 名 = 数据 库 "V 课程 名 =“ 数学 "课程 ) ) 
该 查询 也 可 以 用 交 运 算 实现 , 先 选择 选修 了 数据 库 的 学 生 名 单 , 再 选择 选修 了 数学 的 学 
生 和 名单 ,将 两 次 运算 的 结果 取 交 ,得 到 的 关系 代数 表达 式 为 : 
可 。 (omas--ms#"( 课 程 M 学 习 D4 学 生 )) 站 


Ts Comas--#" (课程 M 学 习 M4 学 生 )) 
【 例 2-17】 查询 被 所 有 学 生 都 选修 的 课程 名 。 
分 析 : 该 查询 用 除法 实现 。 应 用 除法 时 ,首先 确定 除数 : 在 学 生 表 中 投影 出 所 有 学 生 
的 学 号 ; 然后 确定 被 除数 : 在 学 习 表 中 投影 出 学 号 和 课程 号 ; 有 了 被 除数 与 除数 可 以 进行 
除法 运算 ,得 到 被 所 有 学 生 选 修 的 课程 的 课程 号 ; 最 后 在 除法 的 结果 和 课程 表 上 投影 出 “ 课 
程 名 ”: 
机 并 ;ys (学 生 ) ) x 课程) 
【 例 2-18〗 查询 没有 选修 任何 课程 的 学 生 名 单 及 所 在 学 院 。 
分 析 : 该 查询 只 能 用 差 运 算 实现 。 首 先 将 学 习 表 和 学 生 表 自 然 连接 ,可 以 获得 选课 学 
生 的 信息 ,然后 从 学 生 表 中 获得 所 有 学 生 的 相关 信息 ,最 后 将 两 个 结果 进行 差 运 算 , 得 到 的 
关系 代数 表达 式 为 : 
Ts.sm (学 生 ) 一 [[ .sw (学 习 以 学生 ) 
【 例 2-19】〗 查询 和 王 英 在 同一 个 学 院 学 习 的 学 生 学 号 和 姓名 。 
分 析 : 该 查询 的 条 件 需要 用 到 学 生 表 中 的 “姓名 ”和 “学 院 ”, 最 终 查 询 的 信息 需要 用 到 
学 生 表 中 的 “学 号 "和 “姓名 ”, 由 于 用 到 同一 张 表 两 次 ,该 查询 要 通过 自 连接 运算 来 实现 , 关 
系 代数 表达 式 为 : 
Ti1,s (08--E 半 "6-12 (学 生 义 学生)) 
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说 明 : 

(1) 运算 中 使 用 的 属性 列 名 可 以 用 该 属性 列 在 表 中 的 序号 来 代替 ,属性 列 在 表 中 的 序 
号 从 1 开始 。 由 于 自 连 接 需要 用 到 同一 张 表 两 次 , 表 名 和 属性 列 名 都 是 相同 的 ,因此 在 该 类 
运算 中 一 般 采 用 属性 列 序号 。 

(2) 本 题 中 学 生 表 含有 6 列 ,“ 学 生 X 学 生 ” 后 得 到 一 张 12 列 的 表 , 其 中 ,前 6 列 和 后 6 
列 属性 列 名 是 相同 的 ,该 题 中 最 终 查 询 到 的 信息 取 自 前 6 列 ,查询 条 件 里 的 信息 取 自 后 6 
列 ,当然 也 可 以 交换 使 用 的 顺序 。 


*2.3 关系 演算 


对 于 关系 数据 的 查询 ,除了 可 以 用 关系 代数 表达 式 表 示 , 还 可 以 用 数理 逻辑 中 的 一 阶 谓 
词 演算 表示 ,这 就 是 关系 演算 。 关 系 演算 与 关系 代数 相 比 具有 使 用 方便 的 特点 ,是 一 种 高 度 
非 过程 化 语言 ,因为 关系 演算 用 谓词 公式 表示 查询 条 件 , 只 要 指出 “做 什么 ”, 而 “怎么 做 ” 交 
给 系统 解决 。 而 关系 代数 语言 ,用户 须 指出 运算 方法 和 步 又。 

用 谓词 演算 作为 关系 数据 查询 语言 的 思想 ,最早 见 于 Kuhns 的 论文 ,而 把 它 真 正 用 于 
关系 数据 语言 ,提出 关系 演算 概念 的 则 是 E. F. Codd。 他 首先 给 出 了 关系 演算 语言 
ALPHA。 

按 谓 词 变 元 的 不 同 ,关系 演算 可 以 分 为 元 组 关系 演算 和 域 关系 演算 。 


2.3.1 元 组 关系 演算 


元 组 关系 演算 是 以 元 组 变量 作为 谓词 变 元 的 基本 对 象 。 一 种 典型 的 元 组 关系 演算 语言 
是 E.F. Codd 提出 的 ALPHA 语言 。 尽 管 该 语言 并 未 实际 实现 。 然 而 ,世界 上 第 一 个 关系 
数据 库 管理 系统 INGRES 所 使 用 的 QUEL, 正 是 参照 了 ALPHA 语言 研制 的 。 这 两 个 语言 
很 相似 ,主要 区 别 在 于 QUEL 采用 英语 表示 与 (人 ) 或 (V)、. 非 (” ) 及 存在 量词 (3、V ) 这 些 
符号 。 

ALPHA 语言 主要 有 GET、PUT、HOLD、UPDATE、DELETE、DROP 这 6 条 语句 , 语 
句 的 基本 格式 为 : 


操作 语句 ”工作 空间 名 (表达 式 ) : 操作 条 件 


表达 式 用 于 指定 语句 的 操作 对 象 , 它 可 以 是 关系 名 、 属 性 名 。 操 作 条 件 是 一 个 逻辑 表达 
式 , 用 于 查找 满足 条 件 的 元 组 ,操作 条 件 可 以 为 空 。 除 此 之 外 ,还 可 以 在 基本 格式 的 基础 上 
加 上 排序 要 求 等 。 

例如 : 

(1) GET W( 学 生 ) 

该 语句 查询 所 有 学 生 的 数据 。 

(2) GET W( 学 生 . 学院) 

该 语句 查询 学 生 表 中 有 哪些 院 系 。 

(3) GET W( 学 生 . 学 号 ,学 生 . 籍贯 ): 学 生 . 出 生年 份 之 1980 

该 语句 查询 所 有 1980 年 以 后 出 生 的 学 生 学 号 和 籍贯 。 


(4) GET W( 学 生 ) DOWN 出 生年 份 

该 语句 查询 所 有 学 生 的 数据 ,结果 按 出 生年 份 降序 排序 。 

前 面 讲 过 关系 模型 一 般 提供 5 种 基本 操作 : 元 组 插入 、 元 组 删除 .元 组 指定 、 属 性 指定 
和 关系 合并 。 它 们 对 应 于 关系 代数 中 的 5 种 运算 : 并 、 差 .选择 .投影 和 笛 卡 儿 积 。 这 5 种 
运算 都 可 以 用 一 阶 谓词 演算 中 的 公式 表示 出 来 。 

设 r 目 关系 R 和 s 目 关系 S 的 谓词 分 别 为 RC(u) 和 S(v), 用 它们 表示 并 、 差 、 选 择 、 投 影 
和 笛 卡 儿 积 如 下 。 

(1) 并 : RUS={tlIRCDVSCbD }。 

(2) 差 : R 一 S={t|R(t) 人 一 S(t)}。 

(3) 笛 卡 儿 积 : RXS= {t+ | CG?)} CNS)(RGDASCW AtD1]=u[1]A…At[r]= 
uLrjAt[r+1]=v[L1]A*……AtLri+s]=vLs]).。 

(4) 选择 : os (R) 二 {t|R(t) AF')}。 

其 中 ,F' 是 条 件 表达 式 F 在 谓词 演算 中 的 表示 形式 。 

(5) 投影 : TL; CBR) 一 {te | GD RO A tl] = oa] A … A tk] = ui)}. 

其 中 ,t® 表 示 元 组 t 有 上 个 分 量 ,而 t[ 局 表示 元 组 t 的 第 i 个 分 量 ,u[j] 表 示 元 组 u 的 
第 j 个 分 量 。 

由 此 可 见 , 关 系数 据 查 询 可 以 用 一 阶 谓词 演算 公式 来 表示 。 当 然 ,这 里 的 谓词 演算 仅 是 
一 般 谓 词 演 算 的 特殊 情况 , 即 谓词 仅 表示 关系 ,所 以 称 之 为 关系 演算 。 

设 有 关系 模式 S( 学 号 ,姓名 ,性 别 , 出 生年 份 ,学 院 ) ,下面 是 用 元 组 关系 演算 表达 查询 
的 几 个 例子 ,说 明 用 元 组 关系 演算 是 如 何 表示 操作 的 。 

【 例 2-20〗 列 出 计算 机 学 院 的 所 有 学 生 。 

Sm 二 {t|SC(t) 人 t[5]=' 计 算 机 ') 
【 例 2-21】 列 出 所 有 1980 年 以 前 出 生 的 学 生 。 
Su 生年 多 一 {t|SCt) A t[4] 二 1980} 


2.3.2 域 关 系 演算 


域 关 系 演算 表达 式 的 定义 类 似 于 元 组 演算 表达 式 的 定义 ,所 不 同 的 是 公式 中 用 域 变量 
代替 元 组 变量 的 每 一 个 分 量 , 域 变量 的 变化 范围 是 某 个 值 域 而 不 是 一 个 关系 。 域 演算 表达 
式 的 一 般 形式 为 {t be… tlPCbyb,… :t0)) titso，…… ,ti 分 别 是 元 组 变量 + 的 各 个 分 量 
的 域 变量 ,P 是 域 演算 公式 。 下 面 定义 域 演算 的 原子 公式 和 公式 。 

(1) 原子 公式 有 下 列 两 种 形式 。 

@ R(ti,ts,… ,ti): R 是 上 元 关系 ,每 个 t; 是 域 变量 或 常量 。 

@ x0y, 其 中 ,x,y 是 域 变量 或 常量 ,但 至 少 有 一 个 是 域 变量 ,0 是 算术 比较 运算 符 。 

(2) 域 关系 演算 的 公式 也 可 以 使 用 逻辑 运算 符 和 比较 运算 符 ,也 可 用 习 x 和 Vx 形成 新 
的 公式 ,但 变量 x 是 域 变 量 , 不 是 元 组 变量 。 


2.4 查询 优化 


从 2.2.3 节 的 关系 代数 举例 中 可 以 看 到 ,一 个 查询 请 求 可 以 通过 不 同 的 关系 代数 表达 
式 来 表示 。 那 么 系统 应 该 选择 哪 一 种 表达 方式 ,从 而 获得 较 高 的 查询 效率 呢 ? 这 就 是 查询 


关系 数据 府 


击 久 测 


数据 亩 原理 与 应 用 (MySQL 版 ) 


优化 要 解决 的 问题 。 查 询 优 化 在 关系 数据 库 系 统 中 具有 非常 重要 的 地 位 ,是 影响 RDBMS 
整体 性 能 的 关键 因素 。 关 系数 据 库 系统 和 非 过 程 化 的 SQL 能 够 取得 巨大 的 成 功 ,关键 是 得 
益 于 查询 优化 技术 的 发 展 。 

2.4.1 查询 优化 的 必要 性 


1. 关系 代数 表达 式 的 优化 问题 

对 于 同一 个 查询 语句 ,可 以 用 不 同 的 关系 代数 表达 ,但 是 它们 之 间 的 效率 却 可 能 相差 很 
大 ,如 例 2-22 所 示 。 

【 例 2-22】 下 面 以 表 2-13 和 表 2-14 为 例 ,查询 学 号 为 091502 的 学 生 选 修 的 课程 
名 称 。 


BE Mis 《0 识 可 .学 号 = 学 习 .学 号 人 学 习 .学 号 ="091502" (课程 X 学 习 )) 
也 可 以 把 选择 条 件 ( 学 号 =="091502") 移 到 笛 卡 儿 积 中 的 关系 (学 习 ) 前 面 。 
E2= Mas 《0 课程 .学 号 一 学 习 .学 号 《课程 X as 号 ="oolsoz (学 习 )) 
还 可 以 把 选择 条 件 (课程 .学 号 一 学 习 . 学 号 ) 与 笛 卡 儿 积 结合 成 等 值 连接 形式 。 
E3 = Mss (课程 Ree 0 学 号 ="091502" (学 习 )) 
这 三 个 关系 代数 表达 式 是 等 价 的 ,但 执行 的 效率 大 不 一 样 。 由 于 笛 卡 儿 积 运算 的 运算 
量 大 且 产 生 的 中 间 结 果 多 ,所 以 越 早 进行 投影 和 选择 运算 来 减少 中 间 结 果 , 越 能 够 提高 查询 
效率 。 很 显然 ,E2 较 El 先 对 学 习 表 进行 选择 再 和 课程 表 做 笛 卡 儿 积 运算 ,减少 了 中 间 结 
果 , 所 以 E2 的 效率 高 于 E1; E3 对 学 习 表 进行 选择 后 ,将 选择 的 结果 和 课程 表 在 学 号 上 进 
行 等 值 连接 ,将 减少 大 量 的 中 间 结 果 , 因 此 E3 较 E2 的 效率 将 有 显著 的 提高 。 
从 以 上 的 分 析 可 以 看 出 ,选择 不 同 的 关系 代数 运算 顺序 ,就 会 得 到 不 同 的 查询 效率 , 因 
此 ,需要 变换 规则 对 关系 代数 表达 式 进行 等 价 变换 ,从 而 将 同一 查询 请 求 转 换 为 效率 最 高 的 
关系 代数 表达 式 。 
2. 关系 代数 表达 式 的 等 价 变换 规则 
关系 代数 表达 式 的 优化 是 查询 优化 的 基础 课题 。 而 研究 关系 代数 表达 式 的 优化 最 好 从 
研究 关系 代数 表达 式 的 等 价 变换 规则 开始 。 所 谓 关 系 代数 表达 式 的 等 价 是 指 用 相同 的 关系 
代数 代替 两 个 表达 式 中 相应 的 关系 所 得 到 的 结果 是 相同 的 。 两 个 关系 代数 表达 式 E, 和 Es 
的 等 价 写成 El 三 E,。 
规则 1: 连接 和 笛 卡 儿 积 的 交换 律 。 
如 果 E, 和 Es 是 两 个 关系 表达 式 。F 是 既 涉及 E, 中 属性 又 涉及 E, 中 属性 的 限制 条 
件 , 即 下 是 连接 的 条 件 。 那 么 下 式 是 成 立 的 : 
E; XE:=E: XE 
ED EED4 E 
EM E;=EME 
规则 2: 连接 和 笛 卡 儿 积 的 结合 律 。 
如 果 Ei 、E。 和 Es 是 关系 表达 式 , 并 且 F, 和 F, 是 限定 条 件 ,F, 只 涉及 E, 和 了 的 属 
性 ,Fs 只 涉及 Es。 和 Es 的 属性 ,那么 下 式 成 立 : 


(E, XE,) XE,=E' X (E: XE;) 
(EM E: ) [xd Es=ED(EME;) 
Ri Fe Pi Fz 


(EM E;) ME;=EM (EM Es) 
规则 3: 投影 的 串 接 。 


(s(t B= 
两 个 相 邻 投影 可 以 结合 为 一 个 的 前 提 条 件 是 : Li ,L,…,L, 为 属性 集 ,并 且 Li 为 L 
的 子 集 ,L; 为 Ls 的 子 集 ,…,L,-1 为 L。 的 子 集 。 


规则 4: 选择 的 囊 接 。 


oF Car， (E))3or, Ar, (E) 
也 就 是 说 ,两 个 选择 可 以 合并 为 一 个 一 次 查找 所 有 条 件 的 选择 。 
由 Fi 人 Fs 二 Fs 人 Fi, 可 以 直接 得 到 选择 的 交换 律 : 
oF (oF, (E))or, (oF, (E)) 
规则 5: 选择 与 投影 的 交换 。 
如 果 条 件 F 仅 涉及 属性 A ,…, A, ,那么 


TI (or (E)) = oul( [Ta sx (E)) 
更 一 般 地 ,如 果 条 件 下 涉及 不 在 Al,….,A, 中 出 现 的 Bl ,…,B, ,那么 : 


I .Cor(E)) 于 Wn (C07 MO a CE))) 
规则 6: 选择 与 笛 卡 儿 积 的 交换 律 。 
如 果 下 中 所 涉及 的 属性 都 在 El 中 ,那么 ,or (EX E,) 寺 or (Ei) XE,。 
作为 一 个 有 用 的 推论 ,如 果 下 是 Fl AF: 形式 ,并 且 Fi 只 涉及 EE 中 的 属性 ,Fs 只 涉及 
E; 的 属性 ,根据 规则 1、4、6 得 到 : 
or (El X E, )=or, (E1) Xor, (E,) 
更 一 般 地 ,如 果 Fi 只 涉及 E, 中 的 属性 ,而 F: 涉及 E, 和 Ez 两 者 的 属性 ,那么 : 
or (E1 X Ez)=or, (or, (E1) XE,) 
也 就 是 把 选择 放 在 笛 卡 儿 积 前 做 。 
规则 7: 选择 与 并 运算 交换 。 
如 果 有 表达 式 EE 二 EiUE;, 设 在 Ei 中 出 现 的 属性 名 与 在 Es 中 出 现 的 属性 相同 ,或 者 至 
少 给 出 了 这 种 对 应 关系 ,那么 得 到 : 
(BUE)=0r(E)Uor(E,) 
规则 8: 选择 与 差 运算 交换 。 
若 Ei 与 E, 有 相同 的 属性 名 , 则 : 
OF (Ei — E;)=or (Ei)—or(E;) 
规则 9: 投影 与 笛 卡 儿 积 的 交换 律 。 
设 El 和 E, 是 两 个 关系 表达 式 ,而 且 Li 是 Ei 的 属性 集 ,而 且 L: 是 Es 的 属性 集 , 那 么 
下 式 成 立 : 


Tv (ExE)= [I, CE) x IT, CE) 
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规则 10: 投影 与 并 的 交换 律 。 
这 里 要 求 E 和 E, 的 属性 有 对 应 性 ,那么 得 到 : 


UE VE)= [I.Ey Uy I 
2.4.2 查询 优化 的 策略 和 算法 


1. 优化 策略 

对 关系 代数 表达 式 进行 优化 的 主要 策略 包括 以 下 几 点 。 

(1) 在 关系 代数 表达 式 中 尽 可 能 早 地 执行 选择 操作 。 

(2) 合并 笛 卡 儿 积 和 其 后 的 选择 操作 ,使 之 成 为 一 个 连接 运算 。 

(3) 合并 连续 的 选择 和 投影 操作 ,以 免 分 开 运 算 造 成 多 次 扫描 文件 ,从 而 节省 了 操作 
时 间 。 

(4) 找 出 表达 式 里 的 公共 子 表达 式 。 如 果 一 个 表达 式 中 多 次 出 现 某 个 子 表达 式 ,那么 
应 该 将 该 子 表达 式 预 先 计算 出 结果 保存 起 来 ,以 避免 重复 计算 。 

(5) 适当 地 对 关系 文件 做 预 处 理 。 根 据 实 际 需要 对 文件 进行 分 类 排序 或 建立 临时 索 
引 等 。 

2. 优化 算法 

关系 代数 的 优化 是 由 DBMS 的 DML 编译 器 完成 的 。 对 一 个 关系 代数 表达 式 进 行 语 法 
分 析 ,可 以 得 到 一 棵 语法 树 ,叶子 是 关系 , 非 叶 子 节点 是 关系 代数 操作 。 利 用 前 面 的 等 价 变 
换 规则 和 优化 策略 来 对 关系 代数 表达 式 进行 优化 。 

算法 2.1 关系 代数 表达 式 的 优化 。 

输入 : 一 个 关系 代数 表达 式 的 语法 树 。 

输出 : 计算 表达 式 的 一 个 优化 序列 。 

方法 : 

(1) 用 等 价 变换 规则 4, 把 每 个 形 为 cr  \..Ar, (E) 的 子 表达 式 转换 为 串 接 形式 ， 

oF, BO 

(2) 对 每 个 选择 操作 ,使 用 规则 4 一 8, 尽 可 能 地 把 选择 操作 移 到 树 的 叶 端 , 即 尽 可 能 早 
地 执行 选择 操作 。 

(3) 对 每 个 投影 操作 ,使 用 规则 3,5,9 和 10, 尽 可 能 地 把 投影 操作 移 到 树 的 叶 端 。 规 则 
3 可 能 会 使 某 些 投影 操作 消失 ,规则 5 可 能 会 把 一 个 投影 分 成 两 个 投影 操作 ,其 中 一 个 将 靠 
近 叶 端 。 如 果 一 个 投影 是 针对 被 投影 的 表达 式 的 全 部 属性 , 则 可 消去 该 投影 操作 。 

(4) 使 用 规则 3 一 5, 把 选择 和 投影 合并 成 单个 选择 .单个 投影 或 一 个 选择 后 跟 一 个 投 
影 。 使 多 个 选择 .投影 能 同时 执行 或 在 一 次 扫描 中 同时 完成 。 

(5) 将 上 述 步骤 得 到 的 语法 树 的 内 接点 分 组 。 每 个 二 元 运算 (X，U , 一 ) 节点 与 其 直接 
祖先 (不 超过 其 他 的 二 元 运算 节点 ) 的 一 元 运算 节点 (或 ) 分 为 一 组 .如 果 它 的 子孙 节点 
一 直到 叶 都 是 一 元 运算 符 , 则 也 并 入 该 组 .但 如 果 二 元 运算 是 笛 卡 儿 积 ,而 且 后 面 不 是 与 它 
组 合成 等 值 连接 的 选择 时 , 则 不 能 将 选择 和 这 个 二 元 运算 组 成 同一 组 。 

(6) 生成 一 个 程序 ,每 一 组 节点 的 计算 是 程序 中 的 一 步 ,各 步 的 顺序 是 任意 的 ,只 要 保 
证 任何 一 组 不 会 在 它 的 子孙 前 面 计算 。 


【 例 2-23】〗 求 001001 号 学 生 所 选修 的 课程 名 及 成 绩 。 
为 简化 书写 ,对 使 用 到 的 学 生成 绩 管理 数据 库 中 的 属性 和 关系 用 以 下 符号 代替 ; 
课程 表 (C){ 课 程 号 (C# ) ,课程 名 称 (CN) ,任课 教师 (TN)} 
学 习 表 (SC){ 课 程 号 (C# ) ,学 号 (S# ) ,成绩 (G)} 
满足 查询 要 求 的 关系 代数 表达 式 为 ， 
KCN,G (Osc. s# ="001001" Asc.c#=C.c# (SCXC)) 
原始 查询 优化 树 如 图 2-7 所 示 。 
(1) 步骤 1: 由 规则 6, 可 以 把 选择 osc.s#=-o0100* 下 移 至 SC 之 上 ,如 图 2-8 所 示 。 


Tewe 
OsCCHCCH 
中 | 
G SCS4-"001001"ASCCH=C CH 4 
| sc s#= ‘00100r 
x C 
SC C SC 
2-7 原始 优化 树 2-8 步骤 1 


(2) 步骤 2: 由 规则 5, 选 择 与 投影 交换 律 得 到 图 2-9。 
(3) 步骤 3: 由 规则 9, 可 以 把 投影 rcN,c, sc.c#,cc# 下 移 , 如 图 2-10 所 示 。 


Vaye 
i OsCSs#-CCh 
GSC S4-C Ce 由 
lovosccsces 1 IN。 
x 
;4 OsC s#="1001001" 
GsC SH="1001001" 
| © 
SC SC 
图 2-9 步骤 2 2-10 步骤 3 


因此 ,优化 后 的 关系 代数 表达 式 为 : 
Ten,e Cle# ,6 Cosc.s# ='001001:( SC)) bd TLen,e# (C)) 


2.5 关系 系统 


关系 系统 和 关系 模型 是 两 个 密切 相关 而 又 不 同 的 概念 。 把 支持 关系 模型 的 系统 称 为 关 
系 系统 ,这 种 说 法 很 笼统 。 因 为 并 非 关 系 模型 的 每 一 部 分 (关系 数据 结构 .关系 操作 和 完整 
性 规则 ) 都 是 同等 重要 的 ,不 能 苛刻 地 要 求 一 个 关系 系统 支持 关系 模型 的 所 有 组 成 部 分 , 才 | 第 
称 为 关系 系统 。 实 际 上 ,到 目前 还 没有 一 个 关系 系统 产品 是 完全 支持 关系 模型 的 。 因 此 ,要 


地 mm 
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给 出 一 个 关系 系统 的 最 小 要 求 以 及 分 类 的 定义 。 
2.5.1 关系 系统 定义 


一 个 系统 可 定义 为 关系 系统 , 当 且 仅 当 它 支 持 : 

(1) 关系 数据 结构 。 

(2) 支持 选择 .投影 和 (自然 ) 连 接 运算 。 并 且 对 这 些 运算 不 必要 求 定义 任何 物理 存 取 
路 径 。 

显然 ,如 果 一 个 系统 仅 支持 表 数 据 结构 而 没有 选择 .投影 和 连接 运算 功能 , 则 不 能 称 之 
为 关系 系统 。 此 外 ,如 果 一 个 系统 虽然 支持 这 三 种 运算 ,但 要 求 定义 物理 存 取 路 径 ,也 不 能 
称 为 关系 系统 。 同 时 不 要 求 一 个 关系 系统 的 选择 .投影 .连接 运算 和 关系 代数 中 的 相应 运算 
完全 一 样 ,而 只 要 求 有 与 这 三 种 运算 等 价 的 功能 就 行 了 。 

请 读者 考虑 为 什么 关系 系统 除了 要 支持 关系 数据 结构 外 ,还 必须 支持 选择 .投影 .连接 
运算 呢 ? 为 什么 要 求 这 三 种 运算 不 能 依赖 于 物理 存 取 路 径 呢 ? 为 什么 要 求 关 系 系统 支持 这 
三 种 最 主要 的 运算 而 不 是 关系 代数 的 全 部 运算 功能 ? 


2.5.2 关系 系统 分 类 


有 了 关系 系统 的 定义 ,就 可 以 区 分 哪些 系统 是 非 关 系 系统 ,哪些 是 关系 系统 ,是 一 个 什 
么 样 的 关系 系统 。 当 前 根据 关系 系统 的 定义 ,许多 数据 库 系 统 产品 如 Oracle、Sybase、DB2、 
Informix 等 都 是 关系 系统 。 并 且 这 些 产品 都 不 同 程度 地 超过 了 这 些 要 求 。 

按照 E. F. Codd 的 思想 ,根据 支持 数据 结构 S(Structure)、 数 据 操纵 M (Manipulation)、 
完整 性 约束 I (Integrity) 的 不 同 程度 ,可 以 把 关系 系统 分 为 4 类 ,如 图 2-11 所 示 。 


| 国 | 硬 | 到 


(a) 表 式 系统 (b) 最 小 关系 系统 (c) 关系 完备 的 系统 (d) 全 关系 系统 
图 2-11 关系 系统 的 分 类 


(1) 表 式 系统 。 这 类 系统 仅 支持 关系 ( 即 表 ) 数 据 结构 ,不 支持 集合 级 的 操作 。 表 式 系 
统 不 能 算 关系 系统 。 

(2) 最 小 关系 系统 。 它 们 仅 支 持 关 系数 据 结构 和 三 种 关系 操作 。 

(3) 关系 完备 的 系统 。 这 类 系统 支持 关系 数据 结构 和 所 有 的 关系 代数 操作 (功能 上 与 
关系 代数 等 价 )。 目 前 ,Oracle,Sybase,Ingres, DB2,SQL/DS,Rdb/VMS,SQL Server 等 许 
多 系统 都 属于 这 一 类 。 

(4) 全 关系 系统 。 这 类 系统 支持 关系 模型 的 所 有 特征 ,特别 是 数据 结构 中 域 的 概念 、 实 
体 完整 性 和 参照 完整 性 。 实 际 上 ,到 目前 为 止 尚 没有 一 个 系统 是 全 关系 系统 ,但 某 些 系统 已 
经 接近 这 个 目标 。 


”2.5.3 全 关系 系统 的 12 条 基本 准则 
根据 上 面 的 定义 ,全 关系 系统 应 该 完全 支持 关系 模型 的 所 有 特征 。 关 系 模型 的 奠基 人 


E.F. Codd 具体 地 给 出 了 全 关系 系统 应 遵循 的 基本 准则 。 从 实际 意义 上 看 ,这 些 准则 可 以 
作为 开发 .评价 或 购买 关系 型 产品 的 标准 。 从 理论 意义 上 看 , 它 是 对 关系 数据 模型 的 具体 而 
又 深入 的 论述 ,是 从 理论 和 实际 紧密 结合 的 高 度 对 关系 型 DBMS 的 评述 。 

准则 0: 一 个 关系 型 DBMS 必须 能 完全 通过 它 的 关系 能 力 来 管理 数据 库 。 

一 个 关系 型 DBMS 的 关系 能 力 包括 属性 指定 、 元 组 选择 .插入 和 删除 .关系 合并 以 及 数 
据 完整 性 和 并 发 控制 等 。 准 则 0 指出 ,一 个 RDBMS 必须 能 完全 通过 这 些 关系 能 力 来 管理 
数据 库 ,而 不 需要 用 户 介 入 。 

准则 0 的 一 个 推论 是 : 任何 声称 是 关系 型 DBMS 的 产品 ,必须 在 关系 这 个 级 别 上 支持 
数据 的 插入 、 修 改 和 删除 ( 即 一 次 多 个 记录 的 操作 级 别 ) 。 

准则 0 的 另 一 个 推论 是 : 关系 型 DBMS 必须 遵循 下 面 的 信息 准则 和 保证 访问 ( 存 取 ) 
准则 。 

准则 1: 信息 准则 。 关 系 型 DBMS 的 所 有 信息 都 应 在 逻辑 一 级 上 用 一 种 方法 即 表 中 的 
值 显 式 地 表示 。 

呈现 在 用 户 面前 的 “关系 ”( 或 表 ) 是 一 种 逻辑 上 的 概念 ,所 有 的 信息 都 通过 关系 的 元 组 
进一步 , 表 名 、 列 名 和 域名 等 都 用 系统 内 部 的 表 ( 即 数据 字典 的 表 ) 中 的 值 表 示 。 数 据 字 

典 本 身 是 一 个 动态 的 用 来 描述 元 数据 的 关系 数据 库 。 

准则 2: 保证 访问 准则 。 依 靠 表 名 、 主 关键 字 和 列 名 的 组 合 ,保证 能 以 逻辑 方式 访问 关 
系数 据 库 中 的 每 个 数据 项 (分 量 值 )。 

保证 访问 准则 表明 关系 系统 所 采用 的 是 相 联 寻 址 (Association Addressing) 访 问 模 式 ， 
而 不 是 那 种 面向 机 器 的 寻 址 方法 ,这 是 关系 系统 独 有 的 方式 。 

准则 3: 空 值 的 系统 化 处 理 。 全 关系 型 DBMS 应 支持 空 值 的 概念 ,并 用 系统 化 的 方式 

准则 4: 基于 关系 模型 的 动态 联机 数据 字典 。 

数据 库 的 描述 在 逻辑 级 上 应 该 和 普通 数据 采用 同样 的 表示 方式 ,使 得 授权 用 户 可 以 使 
用 查询 一 般 数据 所 用 的 关系 语言 来 查询 数据 库 的 描述 信息 。 

这 一 准则 的 一 个 推论 是 : 每 个 用 户 ( 无 论 是 应 用 程序 员 还 是 最 终 用 户 ) 只 需 学 习 一 种 数 
据 模型 ,而 非 关系 系统 常常 不 具备 这 个 优点 。 

另 一 个 推论 是 ,授权 用 户 可 以 很 容易 地 扩充 数据 字典 ,使 之 变 成 完备 的 主动 的 关系 数据 
字典 。 

准则 5: 统一 的 数据 子 语言 。 

一 个 关系 系统 可 以 具有 几 种 语言 和 多 种 终端 使 用 方式 (如 表格 填空 方式 、 命 令 方式 等 ) 。 
但 必须 有 一 种 庄 言 , 它 的 语句 可 以 表示 为 具有 严格 语法 规定 的 字符 串 ,并 全 面 地 支持 以 下 功 
能 : 数据 定义 ,视图 定义 ; 数据 操作 (交互 式 或 程序 式 ); 完整 性 约束 ; 授权 ; 事务 处 理 功能 
(事务 开始 提交、 回 滚 ) 。 关 系数 据 请 言 是 一 体 化 的 统一 的 数据 子 语言 。 

准则 6: 视图 更 新 准则 。 

所 有 理论 上 可 更 新 的 视图 也 应 该 允许 由 系统 更 新 。 所 谓 “ 理 论 上 可 更 新 的 视图 ”, 是 指 
对 此 视图 的 更 新 要 求 ,存在 一 个 与 时 间 无 关 的 算法 ,该 算法 可 以 无 二 义 性 地 把 更 新 要 求 转换 
为 对 基本 表 的 更 新 序列 。 


时 


尖 孙 浇 据 库 


击 久 剧 
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视图 更 新 准则 对 于 系统 支持 数据 逻辑 独立 性 是 不 可 缺少 的 。 

准则 7: 高 级 的 插入 、 修 改 和 删除 操作 。 即 把 一 个 基本 关系 或 导出 关系 作为 单一 的 操作 
对 象 进行 处 理 。 

准则 8: 数据 物理 独立 性 。 无 论 数据 库 的 数据 在 存储 表示 或 存 取 方 法 上 做 任何 变化 ,应 
用 程序 和 终端 活动 都 保持 逻辑 上 的 不 变性 。 

准则 9: 数据 逻辑 独立 性 。 当 对 基本 关系 进行 理论 上 保持 信息 不 受 损害 的 任何 改变 时 ， 
应 用 程序 和 终端 活动 都 保持 逻辑 上 的 不 变性 。 

为 了 尽 可 能 地 提高 数据 逻辑 独立 性 .DBMS 必须 能 对 理论 上 可 更 新 的 视图 执行 插入 、 
修改 和 删除 操作 , 即 必须 满足 准则 6 。 

准则 10: 数据 完整 性 的 独立 性 。 关 系数 据 库 约束 条 件 必须 是 用 数据 子 语言 定义 并 存储 
在 数据 字典 中 的 ,而 不 是 在 应 用 程序 中 加 以 定义 的 。 

任何 关系 数据 库 必须 满足 两 类 完整 性 约束 条 件 , 即 实体 完整 性 和 参照 完整 性 。 其 中 , 实 
体 完 整 性 针对 的 是 基本 关系 而 不 是 视图 等 导出 关系 。 实 体 完 整 性 要 求 一 个 基本 关系 对 应 现 
实 世 界 中 的 一 个 实体 集 ,并 用 主 关 键 字 作为 每 个 实体 的 唯一 性 标识 , 主 关键 字 不 能 取 空 值 。 
而 参照 完整 性 约束 的 是 两 个 相互 有 关 的 关系 模式 中 的 数据 必须 满足 的 条 件 。 

准则 11: 分 布 独立 性 。 关 系 型 DBMS 具有 分 布 独立 性 。 

分 布 独立 性 是 指 关 系 型 DBMS 具有 这 样 的 数据 子 语言 , 它 使 应 用 程序 和 终端 活动 在 分 
布 数据 的 情况 下 保持 逻辑 不 变性 。 

准则 12: 无 破坏 准则 。 如 果 一 个 关系 系统 具有 一 个 低级 ( 指 一 次 一 个 记录 ) 语 言 , 则 这 
个 低级 语言 不 能 违背 或 绕 过 完整 性 准则 。 

以 上 是 E. F. Codd 给 出 的 衡量 一 个 全 关系 型 DBMS 的 12 条 准则 。 这 12 条 准则 都 以 
准则 0 为 基础 。 但 仅 有 准则 0 是 不 够 的 。 不 支持 信息 准则 ,不 保证 访问 准则 ,不 支持 空 值 准 
则 和 数据 字典 准则 就 不 能 保证 数据 库 的 完整 性 。 和 早期 的 DBMS 相 比 ,这 4 条 准则 使 数据 
库 的 管理 和 控制 (授权 和 完整 性 控制 ) 达 到 了 更 高 的 标准 。 准 则 8 一 11 要 求全 关系 型 DBMS 
具有 4 种 独立 性 。 其 中 ,数据 的 物理 独立 性 和 逻辑 独立 性 已 为 人 们 所 熟知 ,而 数据 完整 独立 
性 和 分 布 独立 性 尚未 被 人 们 重视 。 今 后 ,准则 10 和 11 将 变 得 和 准则 8、 准 则 9 同等 重要 。 


小 结 


关系 运算 理论 是 关系 数据 库 查 询 语言 的 理论 基础 。 只 有 掌握 了 关系 运算 理论 ,才能 深 
刻 理解 查询 语言 的 本 质 和 熟练 使 用 查询 语言 。 

本 章 首先 介绍 了 关系 模型 的 基本 概念 。 关 系 定义 为 元 组 的 集合 ,但 关系 又 有 它 特殊 的 
性 质 。 关 系 模型 必须 遵循 实体 完整 性 规则 、 参 照 完整 性 规则 和 用 户 定义 的 完整 性 规则 。 

关系 代数 的 基本 操作 和 组 合 操作 ,是 本 章 的 重点 。 要 能 进行 两 方面 的 运用 : 一 是 计算 
关系 代数 表达 式 的 值 ; 二 是 根据 查询 语句 写 出 关系 代数 表达 式 的 表示 形式 。 

关系 演算 是 基于 谓词 演算 的 关系 运算 ,理论 性 比较 强 。 主 要 理解 表达 式 的 语义 ,计算 其 
值 ,并 能 根据 简单 的 查询 语句 写 出 元 组 表达 式 。 

查询 优化 是 指 系 统 对 关系 代数 表达 式 要 进行 优化 组 合 ,以 提高 系统 效率 。 本 章 介绍 了 
关系 代数 表达 式 的 若干 变换 规则 和 优化 的 一 般 策略 ,然后 提出 了 一 个 查询 优化 的 算法 。 


为 了 给 关系 系统 一 个 明确 的 定义 ,本 章 从 关系 模型 三 要 素 ( 关 系数 据 结构 .关系 数据 操 
作 和 关系 完整 性 约束 ) 的 角度 ,对 关系 系统 进行 了 定义 和 分 类 ,并 介绍 了 全 关系 系统 应 满足 


的 基本 准则 。 
习 题 2 


2.1 试 述 关 系 模型 的 三 个 组 成 部 分 。 
2.2 一 个 关系 模式 能 否 没有 关键 字 ? 为 什么 ? 


2.3 试 述 关系 模型 的 完整 性 规则 。 在 参照 完整 性 中 ,为 什么 外 部 关键 字 属 性 的 值 也 可 


以 为 空 ?什么 情况 下 才 可 以 为 空 ? 


2.4 一 个 n 行 、m 列 的 二 维 表 (其 中 没有 两 行 或 两 列 全 同 ) ,将 行 或 列 交换 后 ,能 导出 多 


少 个 不 同 的 表 ? 


2.5 ”假定 关系 R 和 S 分 别 有 n 和 wm 个 元 组 , 试 说 明 下 列 运算 结果 中 的 最 小 和 最 大 元 


组 个 数 。 
(1) RUS 
(2) RooS 
(3) oc(R)XS, 其 中 C 是 条 件 表达 式 
(4) [[ ,(R) 一 S, 其 中 ,L 是 属性 集合 
2.6 设 有 关系 R 和 S, 如 表 2-38 和 表 2-39 所 示 。 


表 2-38 关系 有 表 2-39 关系 S 
A B BG A B ee: 
3 6 7 3 4 5 
2 5 el 4 2 8 
六 2 3 
4 4 3 


计算 RU S,R 一 S,RN S,RXS,[[,,(S) ,on.s(R). 
2.7 如果 RR 是 二 元 关系 ,那么 下 面 元 组 表达 式 的 结果 是 什么 ? 
{t|(3u(RO)ARCG)) A CLV tL2j#u[2]))} 


2.8 ”假设 R 和 S 分 别 是 三 元 和 二 元 关系 , 试 把 表达 式 11,s (os-4v3-,(RXS)) 转 换 成 等 


价 的 : 四 汉语 查询 句子 ; @ 元 组 表达 式 ; @ 域 表达 式 。 


2.9 假设 R 和 S 都 是 二 元 关系 , 试 把 元 组 表达 式 {t|RCbDA(3au)(CSCu) AuLl] 到 


t[2])} 转 换 为 等 价 的 : 汉语 查询 句子 ; 四 关系 代数 表达 式 ; @ 域 表达 式 。 
2.10 设 数据 库 中 有 4 个 基本 表 : 


部 门 Dept(D# (部 门 号 ),DName( 部 门 名 称 ),DTel( 电 话 号 码 ),DMan( 经 理工 号 )) 
职工 EMP(E# (职工 号 ),EName( 姓 名 ) ,ESex( 性 别 ) ,EPost( 职 务 ),D# (部 门 号 )) 


工程 PRO(P# (项 目 号 ),PName( 项 目 名 称 ) ,PBud( 经 费 预算 )) 
施工 EP(E# (职工 号 ) ,P# (项 目 号 ), WH( 工 时 )) 


关系 数据 府 


坤 久居 
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(1) 写 出 每 个 表 的 主 码 和 外 码 。 

(2) 用 关系 代数 表达 式 写 出 职务 为 “工程 师 ” 的 姓名 和 部 门 名 称 。 

(3) 用 关系 代数 表达 式 写 出 姓名 为 “ 潘 小 光 ” 的 职工 所 在 的 部 门 名 称 和 所 参与 的 项 目 
名 称 。 

2.11 设 数据 库 中 有 三 个 基本 表 : 

SCSNo( 学 号 ) ,SName( 姓 名 ) ,SSex( 性 别 ) ,SPro( 专 业 方 向 )) 

SCCSNo( 学 号 ) ,CNo( 课 程 号 ) ,Grade( 成 绩 ) ) 

CCCNo( 课 程 号 ) ,CName( 课 程 名 ),CPre( 先 行 课 ) ,CCredit( 学 分 )) 

试用 关系 代数 表达 式 表示 下 列 查询 语句 。 

(1) 找 出 选修 网 络 方向 女 同 学 名 单 。 

(2) 求 选修 15164 课程 的 学 生 姓 名 和 专业 方向 。 

(3) 求 选修 数据 库 原理 与 应 用 课程 的 学 生 姓 名 。 

(4) 同时 选修 人 工 智 能 及 编译 技术 的 学 生 名 单 。 

(5) 没有 被 任何 人 选修 的 课程 名 。 

(6) 没有 选修 任何 课程 的 学 生性 别 和 姓名 。 

(7) 至 少 选修 了 002 号 学 生 选 修 的 全 部 课程 的 学 生 学 号 。 

(8) 求 所 有 课程 被 选修 的 情况 , 列 出 课程 号 .课程 名 .先行 课 ,学 分 .学 号 和 成 绩 。 

(9) 求 每 个 学 生 没 有 选修 的 课程 , 列 出 学 号 .课程 号 。 

2.12 为 什么 要 对 关系 代数 表达 式 进行 优化 ? 

2.13 在 2.1]1 题 中 的 三 个 关系 中 ,用 户 有 一 个 查询 请 句 : 检索 网 络 方向 的 学 生 选 修 先 
行 课 为 计算 机 网 络 的 课程 名 和 课程 学 分 。 

(1) 写 出 该 查询 的 关系 代数 表达 式 。 

(2) 画 出 该 查询 初始 的 关系 代数 表达 式 的 请 法 树 。 

(3) 使 用 本 章 中 介绍 的 优化 算法 ,对 语法 树 进行 优化 ,并 画 出 优化 后 的 语法 树 。 

(4) 写 出 该 查询 优化 的 关系 代数 表达 式 。 


第 3 章 关系 数据 库 标准 语言 SQL 


SQL(Structured Query Language) 是 关系 数据 库 的 标准 语言 ,也 称 结构 化 查询 语言 。 
它 是 介 于 关系 代数 和 元 组 演算 之 间 的 一 种 语言 。SQL 是 一 种 综合 性 的 数据 库 请 言 ,实现 对 
数据 的 定义 ,操纵 和 控制 等 功能 。 本 章 将 对 SQL 的 语法 规则 进行 详细 的 介绍 。 


3.1 SQL 概述 


3.1.1 SQL 的 发 展 


自从 1970 年 美国 IBM 研究 中 心 的 E. F. Codd 提出 关系 模型 ,并 连续 发 表 多 篇 论文 以 
后 ,人 们 对 关系 数据 库 的 研究 日 益 深入 。1972 年 ,IBM 公司 开始 研制 实验 型 关系 数据 库 管 
理 系统 SYSTEM R. 并 且 为 其 配置 了 SQUARE(Specifying Queries As Relational Expression) 
查询 语言 。1974 年 ,Boyce 和 Chamberlin 在 此 基础 上 对 其 进行 改进 ,将 SQUARE 语言 改 
为 SEQUEL(Structured English Query Language) ,后 来 SEQUEL 简称 为 SQL, 即 “结构 式 
查询 语言 ", 并 首先 在 IBM 公司 研制 的 关系 数据 库 系 统 System R 上 实现 。 

由 于 它 具 有 功能 丰富 、 使 用 方便 灵活 .语言 简洁 .易学 等 突出 优点 , 深 受 计算 机 工业 界 和 
计算 机 用 户 的 欢迎 。 各 厂商 纷纷 开发 基于 SQL 的 商业 应 用 产品 ,并 将 SQL 作为 关系 数据 
库 产品 事实 上 的 标准 ,如 Oracle、DB2、Sybase 等 。1986 年 10 月 ,经 美国 国家 标准 局 
(CANSD) 的 数据 库 委员 会 X3H2 批准 ,将 SQL 作为 关系 数据 库 语言 的 美国 标准 ,同年 公布 了 
标准 SQL。1987 年 6 月 ,国际 标准 化 组 织 (International Organization for Standardization，, 
ISO) 将 其 采纳 为 国际 标准 。 这 两 个 标准 现在 称 为 "SQL 86”。ANSI 在 1989 年 10 月 颁布 了 
增强 完整 性 特征 的 SQL 89 标准 ,1992 年 又 公布 了 SQL 92 标准 ,1999 年 发 布 了 SQL 99 ,以 
后 每 隔 几 年 会 推出 一 个 新 版 本 ,目前 最 近 的 版 本 是 SQL 2016 。 

本 章 的 论述 主要 遵循 SQL 92 标准 ,由 于 各 数据 库 厂 商 的 SQL 产品 在 支持 标准 SQL 
92 语法 的 同时 ,在 功能 上 都 做 了 相应 的 扩充 ,在 实现 上 略 有 不 同 . 因 此 ,在 使 用 具体 的 
DBMS 时 ,请 查阅 系统 提供 的 参考 手册 。 


3.1.2 SQL 的 将 点 


SQL 有 许多 优点 ,主要 体现 在 以 下 4 点。 

1. 高 度 非 过 程 化 

“过 程 化 ?是 指 用 户 不 但 要 知道 做 什么 ”, 还 应 该 知道 “怎样 做 ”。 对 于 SQL, 用 户 只 需 
要 提出 “做 什么 ”, 无 须 具体 指明 “怎么 做 "。 例 如 , 存 取 路 径 选 择 、 具 体 处 理 操作 过 程 等 均 由 
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系统 自动 完成 。 这 种 特点 使 得 用 户 更 能 集中 精力 考虑 要 “做 什么 "和 所 要 得 到 的 结果 ,大 大 
提高 了 开发 效率 。 

2. 功能 完备 并 且 一 体 化 

数据 库 的 主要 功能 就 是 通过 数据 库 支持 的 数据 语言 来 实现 的 。SQL 不 但 具有 数据 定 
义 功能 .数据 查询 .数据 操作 功能 、 数 据 控 制 功能 ,而 且 这 些 功能 被 集成 到 一 个 语言 系统 中 ， 
只 要 用 SQL 就 可 以 实现 数据 库 生 命 周期 中 的 全 部 活动 。 可 见 ,SQL 功能 是 完备 的 。 

3. 统一 的 语法 结构 

SQL 可 用 于 所 有 用 户 的 模型 ,包括 系统 管理 员 数据 库 管理 员 、 应 用 程序 员 及 终端 用 
户 , 这 些 用 户 可 以 通过 自 含 式 语言 和 嵌入 式 语言 两 种 方式 对 数据 库 进 行 访问 ,这 两 种 方式 使 
用 统一 的 语法 结构 。 

4. 语言 简洁 ,易学 易 用 

尽管 SQL 的 功能 很 强 , 但 语言 十 分 简洁 ,SQL 完成 核心 功能 只 用 了 以 下 8 个 动词 。 

数据 查询 : SELECT( 查 询 ) 。 

数据 定义 : CREATE( 创 建 ),DROP( 撤 销 ) 。 

数据 操作 : INSERT( 插 入 ) ,UPDATE( 修 改 ) ,DELETE( 删 除 ) 。 

数据 控制 : GRANT( 授 权 ) ,REVOKE( 收 权 ) 。 


3.1.3 SQL 体系 结构 


SQL 支持 关系 数据 库 体系 结构 , 即 外 模式 、 模 式 和 内 模式 。 利 用 SQL 可 以 实现 对 三 级 
模式 的 定义 ,修改 和 数据 的 操作 功能 ,在 此 基础 上 形成 了 SQL 体系 结构 ,如 图 3-1 所 示 。 


用 户 1 用 户 2 用 户 3 sQL 用 户 
[视图 ! 视图 2 外 模式 


基本 表 2 基本 表 3 基本 表 4 模式 


存储 文件 2 存储 文件 3 内 模式 


图 3-1 SQL 体系 结构 


图 3-1 中 对 应 的 几 个 基本 概念 如 下 。 

(1) SQL 用 户 。 可 以 是 应 用 程序 ,也 可 以 是 终端 用 户 。SQL 语句 可 嵌入 在 宿主 语言 的 
程序 中 使 用 ,也 可 以 作为 独立 的 用 户 接口 , 供 交互 环境 下 的 终端 用 户 使 用 。 

(2) 基本 表 , 简 称 基 表 。 它 是 数据 库 中 实际 存在 的 表 , 在 SQL 中 一 个 关系 对 应 于 一 个 
基本 表 。 

(3) 视图 。SQL 用 视图 概念 支持 非 标准 的 外 模式 概念 。 视 图 是 从 一 个 或 几 个 基 表 导出 
的 表 , 虽 然 它 也 是 关系 形式 ,但 它 本 身 不 实际 存储 在 数据 库 中 ,只 存放 对 视图 的 定义 信息 ( 没 
有 对 应 的 数据 )。 因 此 ,视图 是 一 个 虚 表 (Virtual Table) 或 虚 关 系 ,而 基 表 是 一 种 实 关系 


(Practical Relation) 。 


(4) 存储 文件 。 每 个 基 表 对 应 一 个 存储 文件 ,每 个 存储 文件 都 与 外 部 存储 器 上 一 个 物 
理 文 件 对 应 。 一 个 基 表 还 可 以 带 一 个 或 几 个 索引 ,存储 文件 和 索引 一 起 构成 了 关系 数据 库 
的 内 模式 。 

由 此 可 以 看 出 ,一 个 基本 表 可 以 存放 在 多 个 存储 文件 中 ,一 个 存储 文件 也 可 以 存放 多 个 
基本 表 的 数据 ; 一 个 视图 可 以 来 自 多 个 基本 表 , 一 个 基本 表 可 以 构造 多 个 视图 ; 一 个 用 户 
可 以 查询 多 个 视图 ,一 个 视图 也 可 以 被 多 个 用 户 访问 。 


3.2 SQL 的 定义 功能 


3.2.1 基本 表 的 定义 


1. 表 结 构 的 定义 
建立 数据 库 最 重要 的 一 步 就 是 定义 基本 表 的 结构 。SQL 用 于 创建 基本 表 的 语法 结 
构 为 : 
CREATE TABLE < 表 名 > 
(< 列 名 > < 数据 类 型 > [ 列 级 完整 性 约束 条 件 ] 
[,< 列 名 > < 数据 类 型 > [ 列 级 完整 性 约束 条 件 ] … ] 
[,< 表 级 完整 性 约 东 条件 >]; 
说 明 
(1) 表 名 是 所 要 定义 的 基本 表 的 名 字 , 表 可 以 由 一 个 或 多 个 属性 ( 列 ) 组 成 。 
(2) 定义 表 的 各 个 列 时 需要 指明 其 数据 类 型 及 长 度 。 表 3-1 列 出 了 主要 数据 类 型 。 
表 3-1 SQL 92 提供 的 主要 数据 类 型 


类 型 数据 类 型 举例 及 缩写 说 明 
Binary BinaryLargeOBject(BLOB) | 这 种 数据 类 型 以 十 六 进 制 格式 存储 二 进 制 字符 串 的 值 
DC) 这 两 种 数据 类 型 可 以 存储 二 进 制 和 十 六 进 制 数据 ,BIT 数 
BitString 据 类 型 长 度 固定 ,而 BIT VARYING 数据 类 型 具有 可 变 
BIT VARYING(n) 长 度 
Boolean BOOLEAN 这 种 数据 类 型 存储 真 、 假 值 true false 或 unknown 
这 两 种 数据 类 型 可 以 存储 适宜 的 字符 集中 的 任意 字符 组 
CHAR(n) 合 。VARCHAR 数据 类 型 允许 字符 长 度 变 化 ,而 CHAR 
Character | VARCHAR(n) 数据 类 型 只 能 有 固定 的 字符 长 度 。VARCHAR 数据 类 型 
自动 删除 后 继 的 空格 ,而 CHAR 数据 类 型 则 添加 空格 达到 
指定 长 度 
INTEGER 
SMALLINT 
DECIMAL(i,j) 这 些 数 据 类 型 存储 数据 的 准确 值 (整数 或 小 数 ) 或 近似 值 
Numeric 
FLOAT(p,s) ( 浮 点 数 ) 
REAL 
DOUBLE PRECISION 
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续 表 
类 型 数据 类 型 举例 及 缩写 说 明 
这 些 数 据 类 型 处 理 时 间 的 值 。DATE 和 TIME 分 别处 理 日 


i 期 和 时 间 。TIMESTAMP 类 型 存储 着 按 机 器 当前 运行 时 

Temporal | TIMESTAMP 间 计 算出 来 的 值 。INTERVAL 指定 一 个 时 间 间 隔 , 它 是 一 

INTERVAL 个 相对 值 , 用 于 增加 或 减少 一 个 日 期 .时 间或 时 间 截 类 型 数 
据 的 绝对 值 


(3) 完整 性 约束 条 件 。 关 系 完 整 性 约束 包括 实体 完整 性 参照 完整 性 和 用 户 定义 完 
整 性 。 这 三 种 完整 性 约 东 条 件 都 可 以 在 表 的 定义 中 给 出 。 其 中 ,实体 完整 性 定义 表 的 主 
关键 字 (Primary Key) ,参照 完整 性 定义 外 关键 字 (Foreign Key) ,用 户 定 义 完整 性 根据 具 


体 应 用 对 关系 模式 提出 要 求 ,主要 包括 对 数据 类 型 .数据 格式 、 取 值 范围 . 空 值 约束 等 的 
定义 。 

完整 性 约束 ,又 可 分 为 列 完整 性 \ 元 组 完整 性 和 表 级 完整 性 三 个 级 别 。 在 关系 模式 的 定 
义 中 ,最 常 定义 的 是 列 完整 性 约束 和 表 级 完整 性 约束 。 用 户 定义 的 完整 性 规则 属于 列 级 完 
整 性 约束 ,而 实体 完整 性 和 参照 完整 性 都 属于 表 级 完整 性 约束 。 

由 于 完整 性 约束 条 件 也 是 关系 模式 定义 的 一 部 分 ,所 以 下 面 给 出 部 分 完整 性 约束 条 件 
的 定义 方法 。 这 些 完整 性 约束 条 件 被 存 入 系统 的 数据 字典 中 , 当 用 户 操 作 表 中 数据 时 由 
DBMS 自动 检查 该 操作 是 否 违背 这 些 完整 性 约束 条 件 。 

【 例 3-1】 建立 一 个 “学 生 ” 表 , 它 由 学 号 、 姓 名 ,性 别 、 出 生年 份 籍 贯 和 所 在 学 院 6 个 列 
组 成 ,其 中 ,学 号 属性 不 能 为 空 ,并 且 其 值 是 唯一 的 。 


CREATE TABLE 学 生 
(学 号 CHAR(8) NOT NULL UNIQUE, 
姓名 CHAR(8)， 
性 别 ”CHAR(2)， 
出 生年 份 ”SMALLINT, 
籍贯 ”CHAR(8)， 
学 院 CHAR(15)); 
上 述 SQL 语句 执行 后 ,将 建立 一 个 新 的 空 “ 学 生 ” 表 。 其 中 ,NOT NULL 和 UNIQUE 
分 别 说 明 学 号 不 能 取 空 值 和 重复 的 值 ,该 约束 等 同 于 主 码 的 约束 。 
2. 主 关键 字 的 定义 
一 个 关系 可 能 有 多 个 候选 关键 字 ,但 在 定义 基本 表 时 只 能 定义 一 个 主 关键 字 。 一 个 关 
系 的 主 关键 字 由 一 个 或 几 个 属性 构成 ,在 CREATE TABLE 中 声明 主 关键 字 的 方法 如 下 。 
(1) 在 列 出 关系 模式 的 属性 时 ,在 属性 及 其 类 型 后 加 上 保留 字 PRIMARY KEY ,表示 
该 属性 是 主 关键 字 。 
(2) 在 列 出 关系 模式 的 所 有 属性 后 ,再 附加 一 个 声明 : 
PRIMARY KEY (< 属性 1 >[,< 属 性 2>,…]) 
说 明 : 如 果 关键 字 由 多 个 属性 构成 , 则 必须 使 用 第 二 种 方法 。 
【 例 3-2〗 建立 一 个 “学 生 ” 表 , 它 由 学 号 .姓名 .性别 .出 生年 份 . 籍 贯 和 所 在 学 院 6 个 列 
组 成 ,其 中 ,学 号 为 主 关键 字 。 


CREATE TABLE 学生 
(学 号 CHAR(8) PRIMARY KEY, 
姓名 CHAR(8) 
性 别 CHAR(2) 
出 生年 份 、SMALLINT, 
籍贯 CHAR(8) 
学 院 CHAR(15)) 
方法 三 
CREATE TABLE ”学生 
( 学 号 CHAR(8), 
姓名 CHAR(8), 
性 别 CHAR(2), 
出 生年 份 SMALLINT, 
籍贯 CHAR(8), 
学 院 CHAR(15), 
PRIMARY KEY( 学 号 )); 
【 例 3-3】 建立 一 个 “课程 " 表 , 它 由 课程 号 ,课程 名 学时、 开课 学 期 \ 课 程 性 质 5 个 属性 
组 成 ,其 中 ,课程 号 为 主 关 键 字 。 
CREATE ”TABLE ”课程 
( 课程 号 CHAR(8) NOT NULL UNIQUE, 
课程 名 CHAR(15), 
学 时 SMALLINT, 
开课 学 期 CHAR(4), 
课程 性 质 CHAR(15), 
PRIMARY KEY (课程 号 )); 


从 例 3-3 可 以 看 出 ,虽然 非 空 (NOT NULL) 约束 和 唯一 (UNIQUE) 约 东 结 合 在 一 起 
的 作用 等 同 于 主键 (PRIMARY KEY) 约 东 , 但 是 ,二 者 是 可 以 重复 定义 的 。 同 时 ,虽然 主 
键 的 声明 是 可 选 的 ,但 为 每 个 关系 指定 一 个 主键 会 更 好 些 。 
【 例 3-4】 建立 一 个 “学 习 ? 表 , 它 由 学 号 .课程 号 成绩 3 个 属性 组 成 ,其 中 ,学 号 和 课程 
号 为 主 关键 字 。 
CREATE TABLE 学 习 
( 学 号 CHAR(8)， 
课程 号 CHAR(8)， 
成 绩 。 SMALLINT, 
PRIMARY KEY (学 号 , 课程 号 )); 
该 例 中 ,由 于 组 成 主 关键 字 的 属性 有 两 个 : 学 号 和 课程 号 ,所 以 只 能 在 属性 列表 的 最 后 
来 定义 该 主 关键 字 。 
3. 外 部 关键 字 的 定义 
外 部 关键 字 的 定义 是 建立 参照 完整 性 的 约束 , 它 是 关系 模式 的 另 一 种 重要 约束 。 根 据 
参照 完整 性 的 概念 ,在 SQL 中 ,有 两 种 方法 用 于 说 明 一 个 外 部 关键 字 。 
(1) 如 果 外 部 关键 字 只 有 一 个 属性 ,可 以 在 它 的 属性 名 和 类 型 后 面 直接 用 
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“REFERENCES” 说 明 它 参照 了 某 个 表 的 某 些 属性 (必须 是 主 关 键 字 )。 其 语法 格式 是 : 
REFERENCES ”< 表 名 > (< 属性 >) 


(2) 在 CREATE TABLE 语句 的 属性 列表 后 面 增加 一 个 或 几 个 外 部 关键 字 说 明 , 其 
格式 为 : 


FOREIGN KEY (< 属性 1 >) REFERENCES < 表 名 > (< 属性 2>) 


其 中 ,属性 1” 是 外 部 关键 字 ,“ 属 性 2” 是 被 参照 的 属性 。 

【 例 3-5】 建立 一 个 “学 习 ? 表 , 它 由 学 号 .课程 号 成绩 3 个 属性 组 成 ,其 中 ,学 号 和 课程 
号 的 集合 为 主 关键 字 , 同 时 ,学 号 .课程 号 也 分 别 是 外 关键 字 ,分 别 参照 了 学 生 表 中 的 学 号 和 
课程 表 中 的 课程 号 。 

CREATE TABLE 学 习 

( 学 号 CHAR(8)， 

课程 号 CHAR(8)， 

成 绩 。 SMALLINT, 

PRIMARY KEY (学 号 , 课程 号 )， 

FOREIGN KEY( 学 号 ) REFERENCES 学 生 ( 学 号 ) 
FOREIGN KEY( 课 程 ) REFERENCES 课程 (课程 号 ) 

该 例 中 定义 了 两 个 外 关键 字 : 学 习 表 中 的 学 号 和 课程 号 。 根 据 参 照 完 整 性 规则 ,学习 
表 中 的 学 号 要 么 取 空 值 ,要 么 取 学 生 表 中 的 学 号 值 。 但 是 ,由 于 学 习 表 中 的 学 号 又 是 该 关系 
主 关键 字 中 的 属性 ,根据 实体 完整 性 约束 条 件 , 主 属 性 不 能 取 空 值 。 所 以 ,学 习 表 中 的 外 关 
键 字 学 号 只 能 取 学 生 表 中 学 号 的 值 , 不 能 取 空 值 。 另 一 个 外 关键 字 课 程 号 的 取 值 亦 然 。 

4. 默认 值 的 定义 

可 以 在 定义 属性 时 增加 保留 字 DEFAULT 为 表 中 某 列 的 取 值 定义 一 个 默认 值 。 

例如 : 


性 别 ”CHAR(2) ”DEFAULT ' 男 '; 
年 龄 。 SMALLINT DEFAULT 19; 


3.2.2 基本 表 的 修改 和 删除 


1. 修改 基本 表 

随 着 应 用 环境 和 应 用 需求 的 变化 ,有 时 需要 修改 已 经 建立 好 的 基本 表 , 如 增加 列 、 增 加 
新 的 完整 性 约束 条 件 、 修 改 原 有 的 列 定义 或 删除 已 有 的 完整 性 约束 条 件 等 ,此 处 仅 列 出 其 中 
的 部 分 语法 。 

语法 格式 : 

ALTER TABLE < 表 名 > 

[ ADD < 新 列 名 > < 数据 类 型 > [完整 性 约束 ]] 

| [DROP ”< 完整 性 约束 名 >] 

| [ALTER COLUMN < 列 名 >< 数 据 类 型 >] 
其 中 , 表 名 是 要 修改 的 基本 表 ,ADD 子 句 用 于 增加 新 列 和 新 的 完整 性 约束 条 件 ,DROP 子 句 
用 于 删除 指定 的 完整 性 约束 条 件 ,ALTER COLUMN 子 句 用 于 修改 原 有 的 列 定义 ,包括 修 


改 列 名 和 数据 类 型 。 
【 例 3-6】 在 学 生 表 中 增加 “年 龄 "属性 ,类 型 为 SMALLINT。 


ALTER TABLE 学 生 ADD COLUMN 年 龄 SMALLINT; 

【 例 3-7】 在 学 生 表 中 删除 “年 龄 属性。 

ALTER TABLE 学 生 DROP COLUMN 年 龄 ; 

【 例 3-8】 课程 表 中 修改 “课程 名 称 ” 属 性 的 长 度 为 20 位 。 
ALTER TABLE 课程 ALTER COLUMN 课程 名 CHAR(20); 


注意 : 

(1) 可 以 增加 或 减少 某 一 列 的 长 度 ,但 是 修改 后 的 长 度 不 能 小 于 该 列 原 有 数据 的 长 度 。 

(2) 对 于 NULL 值 约束 进行 修改 的 问题 。 该 问题 产生 于 将 某 列 的 约束 从 NULL 改变 
为 NOT NULL 时 ,要 求 指定 的 字段 中 不 能 有 NULL 值 。 如 果 包 含 值 为 NULL 的 字段 , 则 
必须 先 删 掉 所 发 现 的 任何 NULL 值 ,然后 使 用 ALTER TABLE 命令 进行 修改 。 

2. 基本 表 的 删除 

DROP TABLE < 表 名 > [RESTRICT | CASCADE]; 

RESTRICT 表示 如 果 有 视图 或 约束 条 件 涉及 要 删除 的 表 时 ,就 禁止 DBMS 执行 该 命 
令 ; 而 CASCADE 选项 则 将 该 表 与 其 涉及 的 对 象 一 起 删除 。 

【 例 3-9】 假设 已 经 存在 一 个 表 , 表 名 为 “临时 表 ”, 现 将 其 删除 ,并 将 与 该 表 有 关 的 其 
他 数据 库 对 象 一 起 删除 。 


DROP ”TABLE 临时 表 CASCADE; 
3.2.3 索引 的 建立 与 删除 


可 以 用 两 种 方法 从 数据 库 中 获得 数据 。 第 一 种 方法 常 被 称 为 顺序 访问 方式 , 它 需 要 
SQL 检查 每 一 个 记录 以 找到 与 之 相 匹 配 的 数据 项 。 这 种 查找 的 方法 效率 很 低 , 但 它 是 使 记 
录 准 确定 位 的 唯一 方法 。 

第 二 种 获取 数据 的 方法 就 是 使 用 索引 ,数据 库 中 的 索引 可 以 帮 用 户 能 快速 地 获得 想 要 
的 数据 。 索 引 实际 上 是 根据 关系 ( 表 ) 中 某 些 字段 的 值 建立 一 个 树 状 结构 的 文件 。 索 引文 件 
中 存储 的 是 按照 某 些 字段 的 值 排列 的 一 组 记录 号 ,每 个 记录 号 指向 一 个 待 处 理 的 记录 。 所 
以 ,索引 实际 上 可 以 理解 为 根据 某 些 字段 的 值 进行 逻辑 排序 的 一 组 指针 。 

目前 ,很 多 DBMS 直接 使 用 主键 的 概念 建立 主 索引 ,方法 是 建立 基本 表 时 直接 定义 主 
键 , 即 建立 了 主 索引 。 一 个 表 只 能 有 一 个 主 索引 ,同时 用 户 还 可 以 建立 其 他 索引 ,不 同 的 
DBMS 略 有 区 别 , 如 MySQL 有 主 索引 、 候 选 索引 、 普 通 索 引 和 唯一 索引 4 种 类 型 的 索引 ; 
Access 中 有 主 索引 、 重 复 索 引 和 非 重复 索引 ; SQL Server 中 则 是 聚 簇 索 引 、 非 聚 秘 索引 和 
唯一 索引 。 

SQL 支持 用 户 根据 应 用 环境 的 需要 ,在 基本 表 上 建立 一 个 或 多 个 索引 ,以 提供 多 种 存 
取 路 径 , 加 快 查找 速度 。 
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1. 建立 索引 
CREATE [UNIOUE][CLUSTER] INDEX < 索引 名 > ON < 表 名 > (< 列 名 > [< 次 序 >][,< 列 名 >[< 次 序 >]] … ); 


其 中 , 表 名 是 指 要 建立 索引 的 基本 表 的 名 字 ,索引 名 是 用 户 自 己 为 建立 的 索引 起 的 名 字 。 索 
引 可 以 建立 在 该 表 的 一 列 或 多 列 上 ,各 列 名 之 间 用 逗号 分 隔 , 这 种 由 两 列 或 多 列 属性 组 成 的 
索引 , 称 为 “复合 索引 (Composite Index)”。 

UNIQUE 表明 此 索引 的 每 个 索引 值 只 对 应 唯一 的 数据 记录 。CLUSTER 表示 要 建 3 
的 索引 是 聚焦 索引 。 聚 簇 索引 是 指 索引 项 的 顺序 与 表 中 记录 的 物理 顺序 一 致 的 索引 组 织 。 

【 例 3-10】 为 学 生 .课程 和 学 习 表 建立 索引 。 

CREATE UNIQUE INDEX STU_IDX_SNO ON 学 生 (学 号 ); 

CREATE UNIQUE INDEX COU_IDX_CNO ON 课程 (课程 号 ); 

CREATE UNIQUE INDEX SC_IDX_SNO_CNO ON 学 习 (学 号 ASC, 课程 号 DESC); 
其 中 ,ASC 表示 按照 升序 排列 ,DESC 表示 按照 降序 排列 。 

2. 删除 索引 


DROP INDEX < 索引 名 >; 


DROP INDEX 命令 可 以 删除 当前 数据 库 内 的 一 个 或 几 个 索引 。 当 一 个 索引 被 删除 后 ,该 
索引 先前 占有 的 存储 空间 就 会 被 收回 。 但 是 ,DROP INDEX 不 会 影响 PRIMARY KEY 和 
UNIQUE 约束 条 件 ,这 些 约束 条 件 必 须 用 ALTER TABLE…DROP 命令 来 完成 。 

【 例 3-11】 删除 学 生 表 上 在 学 号 上 建立 的 索引 。 


DROP INDEX STU_IDX_SNO; 


虽然 采用 了 索引 技术 可 以 提高 数据 查询 的 速度 ,但 另 一 方面 ,增加 了 数据 插入 删除 和 
修改 的 复杂 性 ,以 及 维护 索引 的 时 间 开 销 。 因 此 ,是 否 使 用 索引 ,对 哪些 属性 建立 索引 ,数据 
库 设 计 人 员 必 须 全 面 考虑 ,权衡 折 中 。 下 面 给 出 几 个 使 用 索引 的 技巧 。 

(1) 对 于 小 表 来 说 ,使 用 索引 性 能 不 会 有 任何 提高 。 

(2) 索引 列 中 有 较 多 不 同 的 数据 时 ,索引 会 使 性 能 有 极 大 的 提高 。 

(3) 当 查 询 要 返回 的 数据 很 少时 ,索引 可 以 优化 查询 (比较 好 的 情况 是 少 于 全 部 数据 的 
25%) ,如 果 要 返回 的 数据 很 多 ,索引 会 加 大 系统 开销 。 

(4) 索引 可 以 提高 数据 的 返回 速度 ,但 是 它 使 得 数据 的 更 新 操作 变 慢 。 如 果 要 进行 大 
量 的 更 新 操作 ,在 执行 更 新 操作 时 先 删除 索引 , 当 执行 完 更 新 操作 后 只 需要 简单 地 恢复 索引 
即 可 。 

(5) 索引 会 占用 数据 库 的 空间 。 如 果 数 据 库 管理 系统 允许 管理 数据 库 的 磁盘 空间 , 那 
么 在 设计 数据 库 的 可 用 空间 时 要 考虑 索引 所 占用 的 空间 。 

(6) 不 要 对 经 常 需要 更 新 或 修改 的 字段 创建 索引 ,更 新 索引 的 开销 会 降低 你 所 期 望 获 
得 的 性 能 。 

(7) 不 要 将 索引 与 表 存 储 在 同一 个 驱动 器 上 。 分 开 存 储 会 去 掉 访问 的 冲突 ,从 而 使 结 
果 返 回 得 更 快 。 


忆 


3.3 数据 查询 


建立 数据 库 的 目的 就 是 为 了 对 数据 库 进 行 操作 ,以 便 能 够 从 中 提取 有 用 的 信息 。 数 据 
库 查询 是 数据 库 的 核心 操作 ,SQL 提供 了 SELECT 语句 进行 数据 库 的 查询 。 
SQL 92 标准 中 SELECT 语句 的 语法 格式 : 


SELECT [ALL | DISTINCT] < 属性 列表 > 

FROM < 表 名 或 视图 名 > [,< 表 名 或 视图 名 >] … 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 列 名 > ] 

[HAVING < 条 件 表 达 式 >] 

[ORDER BY < 列 名 > [ASC | DESC] ]; 

SELECT 语句 的 含义 是 : 根据 WHERE 子 句 中 的 条 件 表达 式 , 从 FROM 子 句 指定 的 
基本 表 中 找 出 满足 条 件 的 元 组 ,并 按 SELECT 子 句 中 指出 的 属性 , 选 出 元 组 中 的 分 量 形 成 

并 不 是 所 有 的 查询 都 会 用 到 所 有 的 子 句 ,最 小 限度 情况 下 ,查询 只 需要 一 个 SELECT 
和 一 个 FROM 子 句 。 实 际 上 ,SELECT 子 句 所 完成 的 功能 类 似 于 关系 代数 中 的 投影 运算 ， 
而 WHERE 子 句 的 功能 类 似 于 关系 代数 中 的 选择 运算 。 

如 果 有 GROUP 子 句 选项 , 则 将 结果 按 列 名 的 值 进行 分 组 ,该 属性 列 值 相等 的 元 组 为 
一 个 组 ,每 个 组 产生 结果 表 中 的 一 条 记录 ,通常 会 在 每 组 中 使 用 集 函 数 。 如 果 GROUP 子 
句 带 有 HAVING 短语 , 则 结果 只 有 满足 指定 条 件 的 组 才 被 选 出 来 。 

ORDER BY 子 句 是 将 查询 的 结果 进行 排序 显示 ,ASC 表示 升序 ,DESC 表示 降序 , 默 
认为 升序 。 

可 选项 [LALLI|DISTINCT] 的 含义 是 ,如 果 没 有 指定 DISTINCT 短语 , 则 默认 为 ALL， 
即 保留 结果 中 取 值 重复 的 行 。 

下 面 将 查询 分 为 简单 查询 .复杂 查询 和 嵌 套 查询 几 类 进行 举例 说 明 ,通过 这 些 例 子 可 以 
看 出 查询 语句 的 丰富 功能 和 灵活 的 使 用 方式 。 

说 明 : 本 节 中 所 有 操作 均 作用 于 学 生成 绩 管理 数据 库 , 该 数据 库 中 包括 学 生 表 、 课 程 表 
和 学 习 表 ,关系 模式 见 表 3-2 一 表 3-4。 


表 3-2 学 生 表 
学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 
091501 王 英 女 河北 1997 计算 机 
091502 王 小 梅 女 江苏 2000 信 电 
091503 张 小 飞 男 江西 1996 计算 机 
091504 孙 志 男 海南 1998 计算 机 
091505 徐 颖 女 江苏 1997 外 文 
男 


091506 钱 易 蒙 河北 2000 信和 电 
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表 3-3 课程 表 表 3-4 学 习 表 

课程 号 课程 名 学 时 先 修 课 程 号 ”课程 性 质 学 号 课程 号 成 绩 
180101 ”C++ 程序 设计 56 必修 091501 180101 78 
180102 ”数据 结构 48 180101 必修 5 es 

0 0 010. 

180103 ”操作 系统 48 180102 类 修 091503 180101 89 
180104 ”数据 库 原理 48 180103 必修 091503 180102 78 
180105 DB_Design 32 180104 选修 091503 180103 70 
二 je 4 ed 091503 180104 90 
091504 180101 59 
091504 180102 50 


091504 180103 


3.3.1 单 表 查 询 


最 简单 的 SQL 查询 只 涉及 一 个 关系 (基本 表 ) ,可 归纳 为 以 下 5 种 操作 。 

(1) 选择 表 中 的 若干 列 (关系 代数 中 的 投影 运算 )， 

(2) 选择 表 中 的 若干 元 组 (关系 代数 中 的 选择 运算 ); 

(3) 对 查询 进行 分 组 

(4) 使 用 集 函 数 ; 

(5) 对 查询 结果 排序 。 

1. SQL 中 的 投影 

关系 代数 中 的 投影 运算 ,对 应 于 SQL 中 利用 SELECT 子 句 指定 属性 的 功能 。 

【 例 3-12】 在 学 生 表 中 找 出 所 有 学 生 的 姓名 和 籍贯 。 

SELECT 姓名 ,籍贯 

FROM 学 生 ; 

输出 的 结果 见 表 3-5。 

与 关系 代数 不 同 ,SQL 语句 的 投影 运算 默认 获得 投影 列 上 的 所 有 元 组 (包括 所 有 的 重 
复元 组 ) , 若 希 望 在 重复 列 上 仅 取 一 次 数值 , 则 添加 关键 字 DISTINCT, 请 看 例 3-13。 

【 例 3-13】 在 学 生 表 中 找 出 所 有 学 生 的 籍贯 。 


SELECT DISTINCT 籍贯 


FROM 学 生 ; 
输出 的 结果 如 表 3-6 所 示 。 
表 3-5 例 3-12 结果 表 3-6 例 3-13 结果 
姓 名 籍 贯 籍 贯 
王 英 河北 河北 
王 小 梅 江苏 江苏 
张 小 飞 江西 江西 
孙 志 鹏 海南 
有 全 


钱 易 蒙 河北 


【 例 3-14】 在 学 生 表 中 找 出 学 生 的 所 有 信息 。 


SELECT 学 号 ,姓名 ,性 别 ,籍贯 ,出 生年 份 , 院 系 
FROM 学 生 ; 


该 查询 可 以 在 SELECT 语句 中 将 所 有 的 属性 列 出 ,同时 也 可 以 使 用 通配符 * ”简化 输 
入 ,如 下 所 示 。 


SELECT * 
FROM 学 生 ; 


输出 的 结果 如 表 3-7 所 示 。 
表 3-7 例 3-14 结果 


学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 

091501 王 英 女 河北 1997 计算 机 

091502 王 小 梅 女 江苏 2000 信 电 

091503 张 小 飞 男 江西 1996 计算 机 

091504 孙 志 鹏 男 海南 1998 计算 机 

091505 徐 颖 女 江苏 1997 外 文 
男 


091506 钱 易 蒙 河北 2000 言 电 

使 用 SELECT 语句 ,不 仅 可 以 选择 出 表 中 存在 的 列 值 , 而 且 可 以 通过 对 列 值 进行 算术 
运算 得 到 表 中 不 存在 的 信息 ,请 看 例 3-15 。 

【 例 3-15〗 查询 学 生 的 姓名 和 年 龄 。 

由 于 表 3-2 中 没有 年 龄 属性 ,所 以 不 能 直接 列 出 年 龄 ,但 是 SELECT 子 句 中 可 以 出 现 
计算 表达 式 , 从 而 可 以 查询 经 过 计算 的 值 。 

SELECT 学 号 ,year(now()) - 出 生年 份 

FROM 学 生 ; 

说 明 : year() 和 now() 是 MySQL 中 处 理 日 期 和 时 间 的 函数 ,now() 返 回 为 获取 当前 日 
期 时 间 ,year() 为 返回 指定 日 期 中 的 年 ,因此 year(now()) 是 获得 当前 年 份 。MySQL 还 支 
持 其 他 日 期 时 间 处 理 函 数 ,如 curdate() .curtime() datediff()……- 其 他 数据 库 管 理 系统 也 
提供 类 似 的 函数 ,只 是 名 称 略 有 区 别 ,如 sqlite 中 获取 当前 年 份 的 表达 式 为 strftime ('%Y '， 
'now ) ,需要 时 可 以 查阅 相关 的 技术 手册 。 

输出 的 结果 如 表 3-8 所 示 。 


表 3-8 例 3-15 结果 


学 号 Expr1001 学 号 Expr1001 
091501 21 091505 21 
091502 18 091506 18 
091503 22 
091504 20 


圩 只 泪 
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【 例 3-16】 给 列 定 义 别 名 。 

从 例 3-15 会 发 现 , 通 过 运算 得 到 的 列 , 系 统 都 会 自动 地 赋 给 它 一 个 列 名 (Expr1001) ,这 
样 的 列 名 隐 涩 难 懂 ,不易 理解 。 在 这 种 情况 下 ,可 以 添加 列 的 别名 ,以 替换 在 结果 中 列 出 的 
默认 列 标题 。 使 用 的 格式 为 : 

COLUMN AS < 别名 > 或 者 “COLUMN < 别名 > 

例 3-15 运用 别名 可 表示 为 : 


SELECT 学 号 ,year(now()) -出 生年 份 AS 年 龄 
FROM 学 生 ; 


输出 的 结果 如 表 3-9 所 示 。 
表 3-9 例 3-16 结果 


学 号 年 ” 龄 学 号 年 龄 
091501 21 091505 21 
091502 18 091506 18 
091503 22 
091504 20 


2. SQL 中 的 选择 运算 
查询 满足 指定 条 件 的 元 组 可 以 通过 WHERE 子 句 实现 。WHERE 子 句 常 用 的 查询 条 
件 如 表 3-10 所 示 。 


表 3-10 常用 的 查询 条 件 


查询 条 件 谓 词 
比较 =,.<>.>.<.>=.<= 

算术 运算 sa—NEx/ 

确定 范围 BETWEEN AND, NOT BETWEEN AND 
确定 集合 IN, NOT IN 

字符 匹配 LIKE, NOT LIKE 

空 值 IS NULL, IS NOT NULL 

多 重 条 件 AND, OR 


下 面 分 别针 对 以 上 列 出 的 查询 条 件 , 给 出 查询 的 实例 。 

1) 比较 运算 

【 例 3-17】 查询 有 不 及 格 课程 的 学 生 的 学 号 .课程 号 及 成 绩 。 
SELECT 学 号 , 课程 号 ,成 绩 


FROM 学 习 
WHERE ”成绩 < 60; 


输出 的 结果 如 表 3-11 所 示 。 


如 果 只 想 查看 有 不 及 格 课程 的 学 生 , 且 重复 的 学 号 只 输出 一 次 , 则 可 以 表示 如 下 。 
【 例 3-18〗 查询 有 不 及 格 课程 的 学 生 的 学 号 。 
SELECT DISTINCT 学 号 


FROM 学 习 
WHERE ”成绩 < 60; 


输出 的 结果 如 表 3-12 所 示 。 


表 3-11 例 3-17 结果 表 3-12 例 3-18 结果 
学 号 课程 号 成 绩 学 号 
091504 180101 59 091504 


091504 180102 50 


2) 多 重 条 件 和 算术 运算 

【 例 3-19】 在 学 生 表 中 找 出 信和 电学 院 2000 年 后 出 生 的 学 生 的 记录 。 
SELECT * 

FROM 学 生 

WHERE 学院 = ' 信 电 ， 

RND 出 生年 份 > = 2000; 

输出 的 结果 如 表 3-13 所 示 。 


表 3-13 例 3-19 结果 


学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 
091502 王 小 梅 女 江苏 2000 信 电 
091506 钱 易 蒙 男 河北 2000 言 电 
3) 确定 范围 


【 例 3-20】 查询 出 生年 份 在 1996 一 1998 年 (包括 1996 年 和 1998 年 ) 的 学 生 的 姓名 ,性 
别 、 学 院 和 出 生年 份 。 
SELECT 姓名 , 性 别 , 学 院 , 出生 年份 


FROM 学 生 
WHERE 出 生年 份 BETWEEN 1996 AND 1998; 


输出 的 结果 如 表 3-14 所 示 。 


表 3-14 例 3-20 结果 


姓 名 性 别 学 院 出 生年 份 

王 英 女 计算 机 1997 

张 小 飞 男 计算 机 1996 

孙 志 鹏 男 计算 机 1998 
纺 


徐 颖 外 文 1997 


才 ww 洪 
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该 查询 等 价 于 : 


SELECT 姓名， 人 性别, 学院， 出 生年 份 
FROM 学 生 

WHERE 出 生年 份 >= 1996 

RND 出 生年 份 <= 1998; 


4) 确定 集合 
【 例 3-21】 查询 信 电 学院 、 理 学 院 和 计算 机 学 院 的 学 生 的 学 号 ,姓名 和 学 院 。 


SELECT 学 号 , 姓名， 学 院 
FROM 学 生 
WHERE 学院 IN ( ' 信 和 电 '，' 理 学 院 '，' 计 算 机 '); 


输出 的 结果 如 表 3-15 所 示 。 


表 3-15 例 3-21 结果 


学 号 姓 名 学 院 
091501 王 英 计算 机 
091502 王 小 梅 信 电 

091503 张 小 飞 计算 机 
091504 孙 志 鹏 计算 机 
091506 钱 易 蒙 信 电 

091511 李 雷 理学 院 


与 IN 相对 的 谓词 是 NOT IN ,用 于 查找 属性 值 不 属于 指定 集合 的 元 组 。 如 查找 不 在 信 
电学 院 、 理 学 院 和 计算 机 学 院 的 学 生 的 学 号 、 姓 名 和 学 院 的 语句 如 下 。 

SELECT 学 号 , 姓名 ,学院 

FROM 学 生 

WHERE 学院 NOT IN (' 信 和 电 '，' 理 学 院 '，' 计 算 机 '); 

5) 字符 匹配 

谓词 LIKE 可 以 用 来 进行 字符 串 的 匹配 。 其 一 般 语法 格式 如 下 : 

[NOT] LIKE '< 匹 配 串 >' [ESCAPE '< 换 码 字 符 >'] 


其 含义 是 查找 指定 的 属性 列 值 与 匹配 串 相 匹配 的 元 组 。 匹 配 串 可 以 是 一 个 完整 的 字符 
串 , 也 可 以 含有 通配符 "%” 和 “_”。%( 百 分 号 ) 代 表 任 意 长 度 (长 度 可 以 为 0) 的 字符 串 ,_( 下 
画 线 ) 代表 任意 单个 字符 。 

【 例 3-22】 查询 所 有 姓 王 的 学 生 的 姓名 、 学 号 和 性 别 。 


SELECT 姓名 , 学 号 , 性 别 
FROM 学 生 
WHERE 姓名 LIKE ' 王 %'; 


输出 的 结果 如 表 3-16 所 示 。 
【 例 3-23】 查找 名 字 中 第 二 个 字 为 “小 ” 字 的 学 生 的 姓名 和 学 号 。 
SELECT 姓名 , 学 号 


FROM 学 生 
WHERE 姓名 LIKE " 小 和 " 


输出 的 结果 如 表 3-17 所 示 。 


表 3-16 例 3-22 结果 表 3-17 例 3-23 结果 
姓 名 学 号 性 别 姓 名 学 号 
王 英 091501 女 王 小 梅 091502 


王 小 梅 091502 女 张 小 飞 091503 


如 果 用 户 要 查询 的 匹配 字符 串 本 身 就 含有 “%” 或 *”, 比 如 要 查 课程 名 为 DB_Design 
的 课程 的 学 分 ,应 如 何 实 现 呢 ?这 时 就 要 使 用 ESCAPE', 对 通配符 进行 转 义 。 

【 例 3-24】 查找 课程 名 是 DB_Design 课程 的 课程 号 .课程 性 质 。 

SELECT 课程 号 , 课程 性 质 

FROM 课程 

WHERE 课程 名 LIKE 'DB\_Design' ESCAPE 八 ， 

ESCAPE \' 短 语 表示 ”\" 为 转 义 字符 ,这 样 匹配 串 中 紧 跟 在 “\” 后 面 的 字符 ” ”不 再 具 
有 通配符 的 含义 ,而 是 取 其 本 身 含义 ,被 转 义 为 普通 的 "~" 字符 。 

输出 的 结果 如 表 3-18 所 示 。 

6) 空 值 

【 例 3-25〗】 某 些 学 生 选 修 某 门 课程 后 没有 参加 考试 ,所 以 有 选课 记录 ,但 没有 考试 成 
绩 , 下 面 查询 缺少 成 绩 的 学 生 的 学 号 和 相应 的 课程 号 。 

SELECT 学 号 , 课程 号 , 成绩 

FROM 学 习 

WHERE 成 绩 IS NULL; 

注意 : 这 里 的 “IS? 不 能 用 等 号 (一 ) 代 替 。 

输出 的 结果 如 表 3-19 所 示 。 


表 3-18 例 3-24 结果 表 3-19 例 3-25 结果 
课 程 号 课程 性 质 学 “学 课 程 号 成 绩 
180105 选修 
091504 180103 


3. 对 查询 结果 进行 分 组 

GROUP BY 子 句 可 以 将 查询 结果 的 各 行 按 一 列 或 多 列 取 值 相等 的 原则 进行 分 组 。 对 
查询 结果 分 组 的 目的 是 为 了 细 化 集 函 数 的 作用 对 象 。 如 果 未 对 查询 结果 分 组 , 集 函 数 将 作 
用 于 整个 查询 结果 , 即 整 个 查询 结果 只 有 一 个 函数 值 。 否 则 , 集 函 数 将 作用 于 每 一 个 组 , 即 
每 组 都 有 一 个 函数 值 。 
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【 例 3-26】 查询 各 个 课程 号 相应 的 选课 人 数 。 


SELECT 课程 号 ，COUNT( 学 号 ) ”AS 选课 人 数 

FROM 学 习 

GROUP BY 课程 号 ; 

输出 结果 如 表 3-20 所 示 。 

该 SELECT 语句 对 学 习 表 按 课程 号 的 取 值 进行 分 组 ,所 有 具有 相同 课程 号 值 的 元 组 为 
一 组 ,然后 对 每 一 组 作用 集 函 数 COUNT 以 求 得 该 组 的 学 生 人 数 。 

如 果 分 组 后 还 要 求 按 一 定 的 条 件 对 这 些 组 进行 筛选 ,最 终 只 输出 满足 指定 条 件 的 组 , 则 
可 以 使 用 HAVING 短语 指定 筛选 条 件 。 

【 例 3-27〗 查询 学 号 在 091501 一 091506 至 少 选修 了 三 门 课程 的 学 生 的 学 号 和 选修 课 
程 的 课程 数 。 

SELECT 学 号 ,COUNT( 课 程 号 ) as 选课 数 

FROM 学 习 

WHERE 学 号 BETWEEN '091501'AND '091506' 


GROUP BY 学 号 
HAVING COUNT( 课 程 号 )> = '3'; 


输出 结果 如 表 3-21 所 示 。 


表 3-20 例 3-26 结果 表 3-21 例 3-27 结果 
课 程 号 选课 人 数 学 号 选 课 数 
180101 3 091501 
180102 3 091503 4 
180103 3 091504 | 
让 a 


180104 


查询 学 号 在 091501 一 091506 至 少 选修 三 门 课程 的 学 生 , 首 先 需 要 通过 WHERE 子 句 
中 的 条 件 , 从 学 习 表 中 筛选 出 学 号 在 091501 一 091506 的 选课 记录 ; 然后 根据 GROUP BY 
子 句 中 指定 的 属性 进行 分 组 , 即 学 号 相同 的 选课 记录 为 一 组 ; 再 用 集 函数 COUNT 对 每 一 
组 计数 ,如 果 某 一 组 的 元 组 数目 大 于 等 于 3, 则 表示 此 学 生 选 修 的 课 至 少 有 三 门 ,应 将 他 的 
学 生 号 选 出 来 。HAVING 短语 指定 选择 组 的 条 件 , 只 有 满足 条 件 ( 即 元 组 个 数 三 3) 的 组 才 
会 被 选 出 来 。 

说 明 : WHERE 子 句 与 HAVING 短语 的 根本 区 别 在 于 作用 对 象 不 同 。WHERE 子 句 
作用 于 基本 表 或 视图 ,从 中 选择 满足 条 件 的 元 组 。HAVING 短语 作用 于 组 ,从 中 选择 满足 
条 件 的 组 。 

4. 使 用 集 函 数 

为 了 进一步 方便 用 户 ,增强 检索 功能 ,SQL 提供 了 许多 集 函 数 , 主 要 如 下 。 

COUNT(LDISTINCTIALL] x ): 统计 元 组 个 数 。 

COUNT(LDISTINCTIALL] < 列 名 >) : 统计 一 列 中 值 的 个 数 。 

SUM([DISTINCT|ALL] < 列 名 >): 计算 一 列 值 的 总 和 (此 列 必须 是 数值 型 ) 。 


AVG(LDISTINCT|ALL] < 列 名 >): 计算 一 列 值 的 平均 值 ( 此 列 必 须 是 数值 型 ) 。 

MAX(LDISTINCTIALL] < 列 名 >) : 求 一 列 值 中 的 最 大 值 。 

MIN(CLDISTINCTIALL] < 列 名 >) : 求 一 列 值 中 的 最 小 值 。 

如 果 指 定 DISTINCT 短语 , 则 表示 在 计算 时 要 取消 指定 列 中 的 重复 值 。 如 果 不 指定 
DISTINCT 短语 或 指定 ALL 短语 (ALL 为 默认 值 ) , 则 表示 不 取消 重复 值 。 

【 例 3-28〗 查询 学 生 总 人 数 。 

SELECT COUNT( * ) AS 总 人 数 

FROM 学 生 ; 

输出 结果 如 表 3-22 所 示 。 

【 例 3-29】 查询 计算 机 学 院 学 生 的 平均 年 龄 。 

SELECT AVG(year(now()) - 出 生年 份 ) AS 平均 年 龄 

FROM 学 生 

WHERE 学 院 = ' 计 算 机 '; 

输出 结果 如 表 3-23 所 示 。 

【 例 3-30】 查询 学 习 180101 号 课程 的 学 生 最 高 分 数 。 

SELECT MAX( 成 绩 ) AS 最 高 分 


FROM 学 习 
WHERE 课程 号 = '180101'; 


输出 结果 如 表 3-24 所 示 。 


表 3-22 例 3-28 结果 表 3-23 例 3-29 结果 表 3-24 例 3-30 结果 
总 人 数 平均 年 龄 最 高 分 


30 21 95 


5. 对 查询 结果 排序 

如 果 没 有 指定 查询 结果 的 显示 顺序 ,DBMS 将 按 其 最 方便 的 顺序 (通常 是 元 组 在 表 中 
的 先后 顺序 ) 输 出 查询 结果 。 用 户 也 可 以 用 ORDER BY 子 句 指定 按照 一 个 或 多 个 属性 列 
的 升序 (ASC) 或 降序 (DESC) 重 新 排列 查询 结果 .其 中 ,升序 ASC 为 默认 值 。 

注意 : ORDER BY 子 句 只 能 用 于 对 最 终 查 询 结果 排序 ,不 能 对 中 间 结 果 排 序 。 


【 例 3-31】〗 查询 选修 了 180102 号 课程 的 学 生 学 号 表 3-25 例 3-31 结果 
和 成 绩 ,查询 结果 按 成 绩 从 高 到 低 排 列 。 
学 号 成 绩 
SELECT 学 号 ,成 绩 091501 80 
FROM 学习 091503 78 


WHERE 课程 号 = '180102， 

ORDER BY 成 绩 DESC 

输出 的 结果 如 表 3-25 所 示 。 

【 例 3-32】 查询 全 体 学 生 情况 ,查询 结果 按 所 在 学 院 的 名 称 升序 排列 ,对 同一 学 院 中 
的 学 生 按 年 龄 降序 排列 。 


091504 50 
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SELECT * 
FROM 学 生 
ORDER BY 学 院 RSC，year(now()) - 出 生年 份 DESC; 


输出 的 结果 如 表 3-26 所 示 。 
表 3-26 例 3-32 结果 


学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 
091508 黎 明 男 北京 1998 采矿 
091507 郭 小 娜 女 江苏 1997 机 电 
091503 张 小 飞 男 江西 1996 计算 机 
091501 王 英 女 河北 1997 计算 机 
091504 孙 志 男 海南 1998 计算 机 
091509 徐 明 男 河北 2000 体育 
091505 徐 上 颖 女 江苏 1997 外 文 
091502 王 小 梅 女 江苏 2000 信 电 
男 


091506 钱 易 蒙 


3.3.2 连接 查询 


一 个 数据 库 中 的 多 个 表 之 间 一 般 都 存在 某 种 内 在 联系 ,它们 共同 提供 有 用 的 信息 。 前 
面 的 查询 都 是 针对 一 个 表 进 行 的 。 若 一 个 查询 同时 涉及 两 个 以 上 的 表 , 则 称 之 为 连接 查询 。 
连接 查询 根据 连接 的 对 象 和 方法 不 同 ,可 以 包含 以 下 几 个 方面 的 内 容 。 

1. 等 值 与 非 等 值 连 接 查 询 

用 来 连接 两 个 表 的 条 件 称 为 连接 条 件 或 连接 谓词 ,其 一 般 格式 为 : 

[< 表 名 1 >. ]< 列 名 1 > < 比较 运算 符 > [< 表 名 2 >. ]< 列 名 2> 


其 中 ,比较 运算 符 主要 有 : = .过 .二 = .<=.,!=。 
此 外 ,连接 谓词 还 可 以 使 用 下 面 的 形式 。 


[< 表 名 1 >. ]< 列 名 1 > BETWEEN [< 表 名 2>. ]< 列 名 2> AND [< 表 名 2>. ]< 列 名 3> 


当 连 接 运 算 符 为 一 时 , 称 为 等 值 连接 ,使 用 其 他 运算 符 时 称 为 非 等 值 连接 。 

说 明 : 

(1) 连接 谓词 中 的 列 名 称 为 连接 字段 。 连 接 条 件 中 的 各 连接 字段 类 型 必须 是 可 比 的 ， 
但 不 必 相 同 。 例 如 ,可 以 都 是 字符 型 ,或 都 是 日 期 型 ; 也 可 以 一 个 是 整 型 , 另 一 个 是 实 型 , 整 
型 和 实 型 都 是 数值 型 ,因此 是 可 比 的 。 但 车 一 个 是 字符 型 , 男 一 个 是 整数 型 则 不 允许 ,因为 
它们 是 不 可 比 的 类 型 。 

(2) 从 概念 上 讲 ,DBMS 执行 连接 操作 的 过 程 是 ,首先 在 表 1 中 找到 第 一 个 元 组 ,然后 
从 头 开 始 顺 序 扫描 或 按 索引 扫描 表 2, 查 找 满足 连接 条 件 的 元 组 ,每 找到 一 个 元 组 , 就 将 表 
1 中 的 第 一 个 元 组 与 该 元 组 拼接 起 来 ,形成 结果 表 中 的 一 个 元 组 。 表 2 全 部 扫描 完毕 后 ,再 
到 表 1 中 找 第 二 个 元 组 ,然后 再 从 头 开 始 顺 序 扫描 或 按 索引 扫描 表 2, 查 找 满 足 连接 条 件 的 
元 组 ,每 找到 一 个 元 组 , 就 将 表 1 中 的 第 二 个 元 组 与 该 元 组 拼接 起 来 ,形成 结果 表 中 的 一 个 


元 组 。 重 复 上 述 操作 ,直到 表 1 全 部 元 组 都 处 理 完毕 为 止 。 

【 例 3-33】 查询 每 个 学 生 及 其 选修 课程 的 情况 。 

学 生 情 况 存放 在 “学 生 ” 表 中 ,学 生 选 课 情 况 存放 在 “学 习 ” 表 中 ,所 以 本 查询 实际 上 同时 
涉及 “学 生 ” 与 “学 习 ” 两 个 表 中 的 数据 。 这 两 个 表 之 间 的 联系 是 通过 两 个 表 都 具有 的 属性 
“学 号 "实现 的 。 要 查询 学 生 及 其 选修 课程 的 情况 ,就 必须 将 这 两 个 表 中 学 号 相同 的 元 组 连 
接 起 来 。 这 是 一 个 等 值 连接 。 完 成 本 查询 的 SQL 语句 为 ; 

SELECT 学 生 . *， 学习 . * 


FROM 学 生 ， 学 习 
WHERE 学 生 . 学 号 = 学习 .学 号 ; 


输出 的 结果 如 表 3-27 所 示 。 


表 3-27 例 3-33 结果 
学 生 . 学 号 姓名 性 别 籍贯 。 出 生年 份 ”学 院 学习 .学 号 课程 号 成 绩 


091501 王 英 女 河北 1997 计算 机 091501 180101 78 

091501 王 英 女 河北 1997 计算 机 091501 180102 80 

091501 王 英 女 河北 1997 计算 机 091501 180103 77 

091503 张 小 飞 男 江西 1996 计算 机 091503 180101 89 

091503 张 小 飞 男 江西 1996 计算 机 091503 180102 78 

091503 张 小 飞 男 江西 1996 计算 机 091503 180103 70 
男 


091503 张 小 飞 江西 1996 计算 机 091503 180104 90 


自然 连接 是 等 值 连接 运算 中 的 一 种 特殊 情况 , 即 按照 两 个 表 中 的 相同 属性 进行 等 值 连 
接 , 且 目标 列 中 去 掉 了 重复 的 属性 列 , 但 保留 了 所 有 不 重复 的 属性 列 。 
【 例 3-34】 自然 连接 “学 生 ” 表 和 “学 习 ” 表 。 
SELECT 学 生 . 学 号 , 姓名, 性别, 出 生年 份 , 学 院 , 课程 号 , 成绩 
FROM 学 生 , 学 习 
WHERE 学 生 . 学 号 = 学习 .学 号 ; 
输出 的 结果 如 表 3-28 所 示 。 
表 3-28 例 3-34 结果 
学 号 姓 名 性 别 籍 贯 出 生年 份 学 院 课程 号 成 绩 


091501 王 英 女 河北 1997 计算 机 180101 78 
091501 王 英 女 河北 1997 计算 机 180102 80 
091501 王 英 女 河北 1997 计算 机 180103 77 
091503 张 小 飞 男 江西 1996 计算 机 180101 89 
091503 张 小 飞 男 江西 1996 计算 机 180102 78 
091503 张 小 飞 男 江西 1996 计算 机 180103 70 
091503 张 小 飞 男 江西 1996 计算 机 180104 90 
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在 本 查询 中 ,由 于 姓名 .性别 . 出 生年 份 . 学 院 、. 课 程 号 和 成 绩 属性 列 在 学 生 与 学 习 表 中 
是 唯一 的 ,因此 引用 时 可 以 去 掉 表 名 前 级 。 而 学 号 在 两 个 表 中 都 出 现 了 ,因此 引用 时 必须 加 
上 表 名 前 级 。 该 查询 的 执行 结果 不 再 出 现 “ 学 习 . 学 号 ” 列 。 

2. 自身 连接 查询 

【 例 3-35】 求 每 一 门 课程 的 间接 先 修 课 ( 先 修 课 的 先 修 课 )。 

分 析 : 题目 要 求 查 询 每 一 门 课程 的 先 修 课 的 先 修 课 , 在 “课程 ” 表 中 ,只 有 每 门 课 的 直接 
先 修 课 信 息 ,而 没有 先 修 课 的 先 修 课 ,要 得 到 这 个 信息 ,必须 先 对 一 门 课 找到 其 先 修 课 , 青 按 
此 先 修 课 的 课程 号 ,查找 它 的 先 修 课程 ,这 相当 于 将 “课程 " 表 与 其 自身 连接 后 , 取 第 一 个 
副本 的 课程 号 与 第 二 个 副本 的 先 修 课 号 进行 等 值 条 件 连 接 。 具 体 写 SQL 请 句 时 ,为 清楚 
起 见 , 可 以 为 课程 表 取 两 个 别名 ,一 个 是 FIRST, 另 一 个 是 SECOND, 也 可 以 在 考虑 问题 
时 就 把 课程 表 认 为 是 两 个 完全 一 样 的 表 , 一 个 是 FIRST 表 , 另 一 个 是 SECOND 表 , 如 下 
所 示 。 

SELECT FIRST. 课程 号 AS 课程 号 ，FIRST. 课程 名 AS 课程 名 ，SECOND. 先 修 课程 号 AS 间接 先 修 课 程 号 

FROM 课程 AS FIRST， 课 程 AS SECOND 

WHERE FIRST. 先 修 课程 号 = SECOND. 课程 号 ; 


输出 的 结果 如 表 3-29 所 示 。 
表 3-29 例 3-35 结果 


课 程 号 课 程 名 间接 先 修 课程 号 
180102 数据 结构 

180103 操作 系统 180101 
180104 数据 库 原 理 180102 
180105 DB_Design 180103 


结合 表 3-3 可 以 看 到 “C++ 程序 设计 ”没有 先 修 课程 ,因此 更 没有 间接 先 修 课 的 信 
息 ;“ 数 据 结构 "的 先 修 课 是 “C++ 程序 设计 ”, 由 于 “C++ 程序 设计 ”没有 先 修 课 ,所 以 “数据 
结构 ?的 间接 先 修 课 为 空 ;:“ 操 作 系统 ”的 先 修 课 是 “数据 结构 ”, 而 “数据 结构 "的 先 修 课 是 
“C++ 程序 设计 ”, 所 以 “操作 系统 ”的 间接 先 修 课 是 “C++ 程序 设计 ”(180101); 以 此 类 推 其 他 
课程 。 

2.2.3 节 中 的 例 2-19 也 可 以 通过 该 方法 进行 查询 ,读者 可 以 自行 练习 。 

3. 外 连接 查询 

在 通常 的 连接 操作 中 ,只 有 满足 连接 条 件 的 元 组 才能 作为 结果 输出 ,如 在 例 3-34 的 结 
果 表 中 没有 关于 091511 和 091512 两 个 学 生 的 信息 ,原因 在 于 他 们 没有 选课 ,在 选课 表 中 没 
有 相应 的 元 组 。 但 是 有 时 想 以 学 生 表 为 主体 列 出 每 个 学 生 的 基本 情况 及 其 选课 情况 ,车 某 
个 学 生 没 有 选课 , 则 只 输出 其 基本 情况 信息 ,其 选课 信息 为 空 值 即 可 ,这 时 就 需要 使 用 外 连 
接 (Outer Join)。 
事实 上 ,在 SQL 92 中 ,连接 操作 是 在 查询 的 JOIN 子 句 中 执行 的 ,连接 方法 可 以 分 为 
theta 方 式 和 ANSI 方 式 两 类 。 前 面 介绍 的 使 用 WHERE 条 件 连 接 方法 属于 theta 方式 ,这 
种 方式 要 实现 外 连接 运算 ,必须 通过 在 WHERE 子 句 中 设置 特殊 的 字符 来 实现 对 外 部 连接 


的 处 理 。 例 如 ,Oracle 在 进行 连接 时 ,需要 将 一 个 外 部 连接 运算 符 “( 十 )” 置 于 外 部 关键 字 
列 的 边 上 。 而 在 较 旧 的 版 本 中 ,Microsoft SQL Server 是 通过 使 用 (* ) 来 实现 这 一 功能 的 。 
ANSI 方 式 是 SQL 92 推荐 的 方式 ,这 种 方式 使 用 JOIN .ON 等 关键 字 配 合 连 接 条 件 完成 连 
接 查 询 操作 。 下 面 分 别 以 左 外 连接 (LEFT OUTER JOIN) 和 右 外 连接 (RIGHT OUTER 
JOIN ) 为 例 , 对 theta 方式 和 ANSI 方式 进行 说 明 。 

1) 左 外 连接 

规定 所 有 记录 都 应 该 从 连接 语句 左 侧 的 表 中 返回 。 当 右 侧 表 中 并 没有 匹配 的 记录 时 ， 
左 表 中 该 记录 依然 会 返回 ,而 对 应 的 右 侧 表 中 的 列 值 将 自动 填充 NULL 值 。 

【 例 3-36】 查询 所 有 学 生 的 姓名 以 及 他 们 选修 课程 的 课程 号 和 成 绩 。 

一 一 theta 方式 : 

SELECT 姓名 ， 课 程 号 ， 成 绩 


FROM 学生， 学习 
WHERE 学 习 .学 号 (+ ) = 学 生 .学 号 ; 


输出 的 结果 如 表 3-30 所 示 。 
表 3-30 例 3-36 结果 


姓 名 课 程 号 成 ” 绩 
王 英 180101 78 
王 英 180102 80 
张 小 飞 180101 89 
张 小 飞 180102 78 
孙 志 180101 59 
孙 志 鹏 180102 50 
于 诚 

-一 ANSI 方 式 ， 

SELECT 姓名 ,课程 号 ,成 绩 

FROM 学 生 

LEFT OUTER JOIN 学 习 ON 学 生 . 学 号 = 学习. 学 号 ; 

2) 右 外 连接 


规定 所 有 记录 都 应 该 从 连接 语句 右 侧 的 表 中 返回 。 当 左 侧 表 中 并 没有 匹配 的 记录 时 ， 
右 侧 表 中 的 值 依然 返回 ,而 对 应 的 左 侧 表 中 的 列 值 将 自动 填充 NULL 值 。 

【 例 3-37】 查询 所 有 的 课程 信息 及 选修 该 课程 的 学 生 的 学 号 及 成 绩 。 

SELECT 课程 名 , 学 号 , 成 绩 


FROM 学 习 , 课 程 
WHERE 课程 .课程 号 = ( + ) 学 习 . 课 程 号 ; 
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一 一 ANSI 方 式 ; 


SELECT 课程 名 ,学 号 ,成绩 
FROM 学 习 
RIGHT OUTER JOIN 课程 ON 学 习 .课程 号 = 课程 .课程 号 ; 


输出 的 结果 如 表 3-31 所 示 。 
表 3-31 例 3-37 结果 


课 程 名 学 号 成 ” 绩 
C++ 程 序 设计 091501 78 
C++ 程序 设计 091503 89 
数据 结构 091501 80 
数据 结构 091503 78 
操作 系统 091501 77 
操作 系统 091503 70 
算法 设计 


全 外 连接 一 般 没 有 什么 意义 ,MySQL 并 不 能 直接 支持 全 外 连接 ,但 可 以 通过 左右 外 连 
接 的 并 集 来 模拟 实现 。 

4. 复合 条 件 连接 查询 

上 面 各 个 连接 查询 中 ,WHERE 子 句 中 只 有 一 个 条 件 ,WHERE 子 句 中 有 多 个 条 件 的 
连接 操作 , 称 为 复合 条 件 连接 。 

【 例 3-38〗 查询 选修 180101 号 课程 且 成 绩 在 90 分 以 上 的 学 生 学 号 ,姓名 及 成 绩 。 

SELECT 学 生 . 学 号 , 姓名 ,成 绩 

FROM 学 生 , 学 习 

WHERE 学 生 . 学 号 = 学 习 .学 号 

AND 学 习 . 课 程 号 = '180101' 

AND 学 习 . 成绩 > 90 


以 上 是 复合 条 件 连接 的 theta 连接 方式 , 若 表示 为 ANSI 连接 方式 , 则 为 以 下 形式 。 


SELECT 学 生 . 学 号 , 姓名 ,成 绩 

FROM 学 生 

JOIN 学 习 ON 学 生 .学 号 = 学 习 . 学 号 
AND 学 习 .课程 号 = '180101' 

AND 学习. 成 绩 >90 


输出 的 结果 如 表 3-32 所 示 。 
表 3-32 例 3-38 结果 


学 号 姓 名 成 ” 绩 
091517 王 高 飞 91 


连接 操作 除了 可 以 是 两 表 连 接 ,一 个 表 与 其 自身 连接 外 ,还 可 以 是 两 个 以 上 的 表 进 行 连 
接 , 后 者 通常 称 为 多 表 连 接 。 

【 例 3-39】 查询 每 个 学 生 及 其 选修 的 课程 名 及 其 成 绩 。 

SELECT 学 生 . 学 号 , 姓名 ,课程 名 ,学习 .成 绩 

FROM ”学 生 , 学习， 课程 


WHERE 学 生 . 学 号 = 学习 .学 号 
AND “学习 .课程 号 = 课程 .课程 号 ; 


以 上 是 多 个 表 的 theta 连接 方式 , 若 表 示 为 ANSI 连接 方式 , 则 为 以 下 形式 。 


SELECT 学 生 . 学 号 , 姓名 ,课程 名 , 学 习 . 成绩 
FROM 学 生 
JOIN 学 习 ON 学 生 . 学 号 = 学 习 . 学 号 
JOIN 课程 ON 学 习 . 课 程 号 = 课程 .课程 号 


输出 的 结果 如 表 3-33 所 示 。 
表 3-33 例 3-39 结果 


学 号 姓 名 课 程 名 成 ” 绩 
091501 王 英 C++ 程序 设计 78 
091501 王 英 数据 结构 80 
091501 王 英 操作 系统 他 
091503 张 小 飞 C++ 程序 设计 89 
091503 张 小 飞 数据 结构 78 


091503 张 小 飞 操作 系统 70 


5. 集合 运算 连接 查询 

有 时 候 , 用 户 希 望 在 SQL 查询 中 利用 关系 代数 中 的 集合 运算 (并 、 交 、 差 ) 来 组 合 关系 ， 
SQL 为 此 提供 了 相应 的 运算 符 : UNION 、INTERSECT、EXCEPT, 分 别 对 应 于 集合 运算 的 
U . 门 .一 。 它 们 用 于 两 个 查询 之 间 ,对 每 个 查询 都 要 用 圆 括号 括 起 来 。 对 于 不 同 的 DBMS， 
支持 的 集合 运算 有 所 不 同 , 如 MySQL 只 支持 并 运算 。 

【 例 3-40】 查询 选修 了 180101 号 或 180102 号 课程 或 二 者 都 选修 了 的 学 生 学 号 .课程 
号 和 成 绩 。 

(SELECT 学 号 , 课程 号 , 成 绩 

FROM 学习 

WHERE ”课程 号 = '180101') 

UNION 

(SELECT 学 号 , 课程 号 , 成 绩 

FROM 学 习 

WHERE 课程 号 = '180102') 

输出 的 结果 如 表 3-34 所 示 。 

与 SELECT 子 句 不 同 ,UNION 运算 自动 去 除 重复 。 因 此 在 本 例 中 , 若 只 输出 学 生 的 


学 号 , 则 相同 的 学 号 只 出 现 一 次 。 如 果 想 保留 所 有 的 重复 , 则 必须 用 UNION ALL 代替 - 


UNION, 且 查询 结果 中 出 现 的 重复 元 组 数 等 于 两 个 集合 中 出 现 的 重复 元 组 数 的 和 。 
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表 3-34 例 3-40 结果 


学 号 课 程 号 成 ” 绩 
091501 180101 78 
091501 180102 80 
091503 180101 89 


091503 180102 78 


【 例 3-41】 查询 同时 选修 了 180101 和 180102 号 课程 的 学 生 学 号 .课程 号 和 成 绩 。 


(SELECT 学 号 , 课程 号 , 成绩 
FROM 学习 

WHERE 课程 号 = '180101') 
INTERSECT 

(SELECT 学 号 , 课程 号 , 成 绩 
FROM 学 习 

WHERE 课程 号 = '180102') 


INTERSECT 运算 自动 去 除 重复 ,如 果 想 保留 所 有 的 重复 ,必须 用 INTERSECT ALL 
代替 INTERSECT ,结果 中 出 现 的 重复 元 组 数 等 于 两 集合 出 现 的 重复 元 组 数 里 较 少 的 那个 。 

【 例 3-42】 查询 选修 了 180101 号 课程 的 学 生 中 没有 选修 180102 号 课程 的 学 生 学 号 、 
课程 号 和 成 绩 。 

(SELECT 学 号 , 课程 号 , 成 绩 


FROM ”学习 

WHERE ”课程 号 = '180101') 
EXCEPT 

(SELECT 学 号 , 课程 号 , 成绩 
FROM 学 习 


WHERE ”课程 号 = '180102') 


EXCEPT 运算 自动 去 除 重复 ,如 果 想 保留 所 有 的 重复 ,必须 用 EXCEPT ALL 代替 
EXCEPT ,结果 中 出 现 的 重复 元 组 数 等 于 两 集合 出 现 的 重复 元 组 数 之 差 (前 提 是 差 是 正 值 )。 

在 不 支持 INTERSECT 和 EXCEPT 运算 的 DBMS 中 ,必须 使 用 其 他 方法 实现 。 其 中 ， 
嵌 套 查询 是 十 分 有 效 的 一 种 方法 。 


3.3.3 上 嵌 套 查询 


在 SQL 中 ,一 个 SELECT…FROM…WHERE 语句 称 为 一 个 查询 块 ,将 一 个 查询 块 嵌 套 在 
另 一 个 查询 块 的 WHERE 子 句 或 HAVING 条 件 中 的 查询 称 为 嵌 套 查询 。 请 看 下 面 的 例子 。 

【 例 3-43〗 查询 选修 了 180101 号 课程 的 学 生 姓 名 。 

可 以 使 用 如 下 的 嵌 套 形式 实现 该 查询 。 


SELECT 姓名 

FROM 学 生 

WHERE 学 号 IN 

(SELECT 学 号 

FROM 学 习 

WHERE 课程 号 = '180101'); 


说 明 : 在 这 个 例子 中 ,下 层 查 询 块 “SELECT 学 号 FROM 学 习 WHERE 课程 号 = 
'180101 ' ”是 嵌 套 在 上 层 查 询 块 *<SELECT 姓名 FROM 学 生 WHERE 学 号 IN” 的 WHERE 
条 件 中 的 。 上 层 的 查询 块 又 称 为 “外 层 查询 六 父 查询 ”或 “ 主 查 询 ”, 下 层 查 询 块 又 称 为 “内 层 
查询 ”或 “ 子 查 询 ”。SQL 人 允许 多 层 嵌 套 查询 , 即 一 个 子 查询 中 还 可 以 嵌 套 其 他 子 查询 。 需 
要 特别 指出 的 是 , 子 查询 的 SELECT 语句 中 不 能 使 用 ORDER BY 子 句 ,ORDER BY 子 句 
永远 只 能 对 最 终 查询 结果 排序 。 

嵌 套 查询 的 求解 方法 是 由 里 向 外 一 层 层 处 理 。 根 据 子 查询 是 否 独立 于 父 查询 ,可 以 将 
嵌 套 查询 分 为 两 大 类 : 不 相关 子 查询 ,该 类 中 的 子 查询 独立 于 上 层 的 父 查询 ,每 个 子 查询 
在 其 上 一 级 查询 处 理 之 前 可 以 完成 求解 , 子 查询 的 结果 用 于 建立 其 父 查询 的 查找 条 件 ; 
@ 相 关子 查询 ,该 类 中 的 子 查询 依赖 于 父 查询 ,最 内 层 子 查 询 的 执行 需要 用 到 上 层 父 查询 中 
的 某 些 属性 值 ,因此 最 内 层 的 子 查询 不 能 独立 于 父 查 询 先 完成 。 

谋 套 查询 使 得 可 以 用 一 系列 简单 查询 构成 复杂 的 查询 ,从 而 明显 地 增强 了 SQL 的 查询 
能 力 。 以 层 层 嵌 套 的 方式 来 构造 程序 正 是 SQL(Structured Query Language) 中 “结构 化 ” 
的 含义 所 在 。 

嵌 套 查询 主要 内 容 如 下 。 

1. 带 有 IN 谓词 的 子 查询 

带 有 IN 谓词 的 子 查询 是 指 父 查询 与 子 查询 之 间 用 IN 进行 连接 ,判断 某 个 属性 列 值 是 
和 否 在 子 查询 的 结果 中 。 由 于 在 嵌 套 查询 中 , 子 查询 的 结果 往往 是 一 个 集合 ,所 以 谓词 IN 是 
嵌 套 查询 中 最 经 常 使 用 的 谓词 。 

【 例 3-44】 查询 与 王 颖 在 同一 个 学 院 学 习 的 学 生 学 号 和 姓名 。 

查询 与 “ 王 颖 ?在 同一 个 学 院 学 习 的 学 生 ,可 以 首先 确定 “ 王 颖 ?所 在 学 院 名 ,然后 再 查找 
所 有 在 该 学 院 学 习 的 学 生 。 所 以 可 以 分 步 来 完成 此 查询 。 

(1) 确定 “ 王 颖 ?所 在 学 院 名 。 

SELECT ”学院 

FROM 学 生 

WHERE 姓名 = ' 王 颖 '; 

若 假设 结果 为 Q。 
(2) 查找 所 有 在 Q 学 院 学 习 的 学 生 学 号 和 姓名 。 
SELECT 学 号 , 姓名 


FROM 学 生 
WHERE ”学院 IN 'Q'; 


若 用 嵌 套 查询 的 形式 , 则 可 以 表示 为 : 


SELECT 学 号 , 姓名 
FROM ”学生 

WHERE 学院 IN 
(SELECT 学院 

FROM 学 生 

WHERE ”姓名 = ' 王 颖 ' ) 
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【 例 3-45】 查询 选修 了 “数据 库 原理 ”课程 的 学 生 学 号 和 姓名 。 


SELECT ”学 号 , 姓名 
FROM 学 生 
WHERE 学 号 IN 
(SELECT 学 号 
FROM 学 习 
WHERE ”课程 号 IN 

( SELECT ”课程 号 

FROM ”课程 

WHERE 课程 名 = ' 数 据 库 原理 ')); 


输出 的 结果 如 表 3-35 所 示 。 
本 查询 也 可 以 用 非 嵌 套 的 形式 表示 。 
SELECT 学 生 . 学 号 ,姓名 


表 3-35 例 3-45 结果 
学 号 姓 名 


FROM 学生, 学习, 课程 

WHERE 课程 .课程 名 称 = ' 数 据 库 原理 ' 
RND 学生. 学 号 = 学 习 . 学 号 

AND 学习 .课程 号 = 课程 .课程 号 ; 


2. 带 有 比较 运算 符 的 子 查 询 


091503 张 小 飞 


例 3-45 中 “数据 库 原理 ”课程 的 课程 号 是 唯一 的 ,但 选修 该 课程 的 学 生 并 不 只 有 一 个 ， 
所 以 也 可 以 用 “一 "运算 符 和 IN 谓词 共同 完成 。 


SELECT 学 号 , 姓名 
FROM 学 生 
WHERE 学 号 IN 
(SELECT 学 号 
FROM 学 习 
WHERE 课程 号 = 
(SELECT 课程 号 
FROM 课程 
WHERE 课程 名 = 数据 库 原理 ')) 


3. 带 有 ANY 或 ALL 谓词 的 子 查询 


子 查询 返回 单 值 时 可 以 用 比较 运算 符 。 当 返回 的 结果 有 可 能 不 止 一 个 时 , 则 不 能 够 使 
用 比较 运算 符 , 此 时 ,可 以 使 用 ANY 或 ALL 谓词 来 实现 比较 操作 ,而 使 用 ANY 或 ALL 谓 
词 时 则 必须 同时 使 用 比较 运算 符 ,其 语义 如 表 3-36 所 示 。 


表 3-36 比较 运算 符 


运 算 符 ANY ALL 
ES 大 于 子 查询 结果 中 的 某 个 值 大 于 子 查询 结果 中 的 所 有 值 
< 小 于 子 查询 结果 中 的 某 个 值 小 于 子 查询 结果 中 的 所 有 值 
> 大 于 等 于 子 查询 结果 中 的 某 个 值 大 于 等 于 子 查询 结果 中 的 所 有 值 
过 所 小 于 等 于 子 查询 结果 中 的 某 个 值 小 于 等 于 子 查询 结果 中 的 所 有 值 
至 等 于 子 查询 结果 中 的 某 个 值 通常 没有 实际 意义 
二 不 等 于 子 查询 结果 中 的 某 个 值 不 等 于 子 查询 结果 中 的 任何 一 个 值 


【 例 3-46】 查询 其 他 学 院 中 比 计 算 机 学 院 某 个 学 生年 龄 小 的 学 生 名 单 。 


SELECT 姓名 

FROM 学 生 

WHERE Year(now()) 一 出 生年 份 < ANY 
(SELECT year(now()) - 出 生年 份 
FROM ”学生 


WHERE ”学院 = "计算 机 ' ) 
RND 学 院 <> ' 计 算 机 ' 
ORDER BY year(now()) - 出 生年 份 DESC; 


该 查询 的 含义 是 : 其 他 学 院 中 的 学 生 只 要 比 计算 机 学 院 中 的 某 个 学 生 的 年 龄 小 ,就 可 
以 选择 满足 条 件 , 换 句 话说 , 若 其 他 院 系 中 的 某 个 学 生 的 年 龄 比 计算 机 学 院 中 的 年 龄 最 大 的 
学 生 小 , 则 该 学 生 一 定 满足 选择 的 条 件 , 所 以 本 查询 实际 上 也 可 以 用 集 函 数 MAX 实现 。 语 
句 如 下 。 


SELECT 姓名 ,year(now()) - 出 生年 份 
FROM 学 生 

WHERE ”year(now()) 一 出 生年 份 < 
(SELECT MAX(year(now()) -出 生年 份 ) 
FROM 学 生 

WHERE ”学院 = ' 计 算 机 ') 

AND 学 院 <> ' 计 算 机 ' 

ORDER BY year(now()) - 出 生年 份 DESC; 


事实 上 ,用 集 函 数 实现 子 查询 通常 比 直接 用 ANY 或 ALL 查询 效率 要 高 。ANY 与 
ALL 与 集 函 数 的 对 应 关系 如 表 3-37 所 示 。 


表 3-37 ANY、ALL 谓词 与 集 函 数 及 IN 谓词 的 等 价 转换 关系 


三 一 二 或 != < > >= 
ANY IN 一 < <MAX <=MAX >MIN = MIN 
ALL 二 到 NOT IN <MIN <MIN MAX >>MAX 


上 述 嵌 套 查询 均 属 于 不 相关 子 查询 ,其 执行 过 程 都 是 按照 由 内 到 外 的 顺序 , 先 独立 完 
最 内 层 的 子 查询 ,然后 将 查询 的 结果 作为 上 层 父 查 询 的 条 件 , 由 上 层 父 查询 再 继续 逐 层 执 
行 , 最 终 完成 整个 查询 过 程 。 

4. 带 有 EXISTS 谓词 的 子 查询 

EXISTS 代表 存在 量词 3 。 带 有 EXISTS 谓词 的 子 查询 不 返回 任何 数据 ,只 产生 偿 辑 
真 值 “true” 或 者 逻辑 假 值 *false”。 

【 例 3-47】 查询 选修 了 180102 号 课程 的 学 生 学 号 和 姓名 。 

使 用 EXISTS 的 嵌 套 查询 语句 表示 如 下 。 


SELECT 学 号 ,姓名 
FROM ”学 生 
WHERE EXISTS 
(SELECT * 
FROM 学 习 
WHERE 学 生 . 学 号 = 学 习 .学 号 
AND 。 学习 .课程 号 = '180102'); 
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输出 的 结果 如 表 3-38 所 示 。 


该 语句 的 执行 顺序 是 : 从 学 生 表 中 依次 取出 每 表 3-38 例 3-47 结果 
个 元 组 的 学 号 ,用 此 值 去 检查 学 习 表 。 若 学 习 表 中 姓 名 学 号 
存在 这 样 的 元 组 ,其 学 号 值 与 此 学 生 . 学 号 值 相 等 ， 王 英 091501 
并 且 该 学 生 学 习 的 课程 号 为 180102, 则 取 此 学 生 的 张 小 飞 091503 
学 号 和 姓名 送 入 结果 表 中 。 至 ee 


由 EXSITS 引出 的 子 查 询 , 其 目标 列表 达 式 通 
常 都 用 “x*”, 因 为 带 EXSITS 的 子 查询 只 返回 真 值 或 假 值 ,给 出 列 名 无 实际 意义 。 

与 EXISTS 谓词 相对 应 的 是 NOT EXISTS 谓词 ,车 内 层 结果 为 空 , 则 NOT EXISTS 
结果 为 真 ,外 层 的 WHERE 子 句 返回 真 值 ,否则 返回 假 值 。 

【 例 3-48】 查询 没有 选修 180102 号 课程 的 学 生 学 号 和 姓名 。 

使 用 NOT EXISTS 的 嵌 套 查询 语句 表示 如 下 。 

SELECT 学 号 ,姓名 

FROM ”学生 

WHERE NOT EXISTS 

(SELECT * 
FROM 学 习 
WHERE 学 生 .学 号 = 学 习 . 学 号 
RND 学习. 课程 号 = '180102'); 

该 语句 的 执行 顺序 是 : 从 学 生 表 中 依次 取出 每 个 元 组 的 学 号 ,用 此 值 去 检查 学 习 表 。 
若 学 习 表 中 某 元 组 不 存在 这 样 的 情况 ,其 学 号 值 与 此 学 生 . 学 号 值 相等 ,并 且 该 学 生 学 习 的 
课程 号 为 180102, 则 取 此 学 生 的 学 号 和 姓名 送 入 结果 表 中 ,从 而 表示 了 没有 选修 180102 号 
课程 的 学 生 信 息 ,实现 了 差 运算 相同 的 效果 。 

可 以 看 出 ,由 EXISTS 和 NOT EXISTS 引导 的 子 查询 属于 相关 子 查询 ,因为 子 查询 在 
执行 过 程 中 ,需要 用 到 父 查询 的 表 中 相应 的 属性 值 。 

注意 : 一 些 带 EXISTS 或 NOT EXISTS 谓词 的 子 查询 不 能 被 其 他 形式 的 子 查询 所 代 
替 , 但 是 所 有 带 IN 谓词 .比较 运算 符 .ANY 和 ALL 谓词 的 子 查询 都 能 够 用 EXISTS 谓词 
的 子 查询 等 价 替换 。 

例如 , 例 3-45 可 以 用 带 EXISTS 的 子 查询 替换 为 : 

SELECT ”学 号 , 姓名 

FROM 学生 

WHERE EXISTS 

(SELECT * 
FROM 学 习 , 课 程 
WHERE 学 习 . 课 程 号 = 课程 .课程 号 
AND ”学 生 .学 号 = 学 习 . 学 号 
AND ”课程 名 = 数据库 原理 
【 例 3-49】 查询 至 少 选修 了 091501 号 学 生 选 修 的 全 部 课程 的 学 生 学 号 。 
本 查询 是 一 个 典型 的 除法 问题 ,其 关系 代数 可 以 表示 为 : 


I ss ngs (学 习 ) = [ngs (ors- os 学习) 


通过 第 2 章 的 学 习 可 知 ,能 够 使 用 除法 的 查询 ,其 查询 条 件 中 必 含 有 “一 个 集合 包含 另 


一 个 集合 ”的 概念 ,因此 在 转换 成 SQL 语句 时 ,首先 要 找 出 这 两 个 集合 ,其 次 需要 通过 一 定 
的 运算 来 确定 一 个 集合 包含 另 一 个 集合 。 

设 有 两 个 集合 A 和 B, 证 明 A 包含 B, 即 A 汪 B。 如 果 正 向 证 明 , 只 能 通过 穷 举 的 方法 ， 
即 检查 B 集 合 中 的 每 个 元 素 是 否 在 A 集合 中 。 可 以 看 出 ,该 方法 不 具有 通用 性 和 自动 化 
性 。 因 此 考虑 用 逆向 证 明 ,B 一 A 得 到 的 是 “在 B 集 合 中 有 的 ,而 在 A 集合 中 没有 的 元 素 ”， 
如 果 该 结果 集 为 空 , 则 说 明 B 集合 中 的 元 素 都 存在 于 A 集合 中 , 即 AB。 
因此 可 以 得 出 : A=B 三 ” 了 (B 一 A) ,其 中 , ”了 表示 “不 存在 ”。 

在 本 题 中 , 设 A 集合 表示 某 个 学 生 选 修 课 程 的 课程 号 集合 ,B 集合 表示 090101 号 学 生 
选修 的 课程 号 集合 ,根据 题 意 ,如 果 A 集合 大 于 等 于 了 B 集合 , 即 AB, 则 当前 这 个 学 生 是 要 
查找 的 学 生 ,需要 将 其 学 号 送 入 结果 表 。 对 应 的 SQL 语句 如 下 。 

(1) 第 一 步 : 明确 两 个 集合 。 

A 集合 表示 为 : 

SELECT 课程 号 


FROM 学 习 
WHERE 学 习 , 学 号 = "xxx'(xxx 表示 某 个 学 生 的 学 号 ) ; 


B 集合 表示 为 : 


SELECT 课程 号 
FROM 学 习 
WHERE 学 习 .学 号 = '091501'; 


(2) 第 二 步 : 表示 A 包含 B, 即 了 3 (B 一 A)。 


NOT EXISTS 
( (SELECT 课程 号 
FROM 学 习 AS First 
WHERE First. 学 号 = '091501') 
EXCEPT 
(SELECT 课程 号 
FROM 学 习 AS Second 
WHERE ”Second. 学 号 = "xxx')); 


其 中 ,由 于 用 到 学 习 表 两 次 ,为 了 方便 引用 ,分 别 对 其 取 了 别名 。 

(3) 第 三 步 : 得 到 查询 的 信息 。 

本 题 最 终 要 查找 的 是 学 生 的 学 号 ,而 查找 过 程 中 需要 对 每 个 学 生 进 行 筛 选 , 因 此 选用 学 
生 表 ; 


SELECT 学 号 
FROM 学 生 
WHERE NOT EXISTS 
( (SELECT 课程 号 
FROM 学 习 AS First 
WHERE First. 学 号 = '091501') 
EXCEPT 
(SELECT 课程 号 
FROM 学 习 AS Second 
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WHERE ”Second. 学 号 = 学 生 . 学 号 )); 

此 时 ,Second. 学 号 不 再 是 “未 知 值 ”, 而 是 “学 生 . 学 号 ”, 因 为 要 对 学 生 表 中 的 每 个 学 生 
检查 一 遍 , 故 从 学 生 表 中 依次 取出 每 个 学 生 的 学 号 , 放 到 内 层 查询 中 进行 检验 ,符合 条 件 的 
学 生 将 其 学 号 送 入 结果 表 中 。 

由 于 “ 差 运 算 (EXCEPT)” 也 可 以 由 “NOT EXISTS” 来 表示 ,因此 可 以 进一步 表示 成 如 
下 形式 。 


SELECT 学 号 
FROM 学 生 
WHERE NOT EXISTS 
( SELECT x 
FROM 学 习 AS First 
WHERE First. 学 号 = '091501'AND NOT EXISTS 
( SELECT * 
FROM 学习 RS Second 
WHERE ”Second. 学 号 = 学生. 学 号 
RND Second. 课程 号 = First. 课 程 号 )); 
说 明 : 由 于 “NOT EXISTS” 不 关心 返回 的 内 容 , 只 关心 是 否 有 值 返 回 ,因此 内 层 查 询 的 
SELECT 语句 中 可 以 用 “ x* ”替代 。 
【 例 3-50】 查询 选修 了 全 部 课程 的 学 生 的 姓名 。 
本 查询 也 是 一 个 典型 的 除法 问题 ,其 关系 代数 可 以 表示 为 : 
TI 。。 .was (学 习 更 等 和 全) 入 TT ws (课程 
设 A 代表 某 个 学 生 的 选课 集合 ,B 代表 全 部 课程 的 集合 ,根据 题目 要 求 “ 选 修了 全 部 课程 
可 知 ,A 集合 中 的 课程 号 应 该 包含 B 集合 中 的 所 有 课程 号 ( 即 A 之 B) ,符合 该 条 件 的 学 生 的 
姓名 就 是 最 终 查询 的 结果 。 因 此 ,可 以 按 如 下 三 步 进 行 除法 的 求解 。 
(1) 第 一 步 : 明确 两 个 集合 。 
A 集合 表示 为 : 
SELECT ”课程 号 
FROM 学 习 
WHERE 学 习 . 学 号 = 'xxx'(xoex 表示 某 个 学 生 的 学 号 ); 
B 集合 表示 为 : 
SELECT 课程 号 
FROM 课程 ; 
(2) 第 二 步 : 表示 A 包含 B, 即 了 3 (B 一 A)。 


NOT EXISTS 
( (SELECT 课程 号 


FROM 学 习 
WHERE 学 习 . 学 号 = ex')); 


(3) 第 三 步 : 得 到 查询 的 信息 。 


SELECT 姓名 
FROM 学 生 
WHERE NOT EXISTS 
( (SELECT * 
FROM 课程 
WHERE NOT EXISTS 
(SELCET * 
FROM 学 习 
WHERE 学 号 = 学生 .学 号 
AND ”课程 号 = 课程 .课程 号 )); 


【 例 3-51】 查询 被 所 有 学 生 都 选修 的 课程 名 称 。 


SELECT 课程 名 
FROM 课程 
WHERE NOT EXISTS 
(SELECT * 
FROM 学 生 
WHERE NOT EXISTS 
(SELCET * 
FROM 学 习 
WHERE 学 号 = 学 生 .学 号 
AND ”课程 号 = 课程 .课程 号 )); 


通过 上 述 例 题 可 以 看 出 ,除法 的 求解 主要 分 为 三 步 : 首先 根据 题目 描述 , 找 出 两 个 集合 
A 和 B, 并 且 明 确 两 个 集合 之 间 的 包含 关系 A 二 B; 然后 表示 出 A 包含 B 的 关系 ,也 就 是 写 
成 NOT EXISTS(B 一 A) 的 形式 ; 最 后 根据 题目 所 要 查询 的 信息 , 写 出 最 外 层 的 查询 ,并 完 
善 最 内 层 查 询 的 条 件 。 由 于 子 查询 的 连接 谓词 是 NOT EXISTS, 因 此 需要 在 最 内 层 的 查询 
条 件 中 给 出 需要 用 到 父 查询 中 的 属性 。 


3.4 数据 更 新 
SQL 对 数据 的 更 新 包括 数据 插入 、 删 除 和 修改 三 个 方面 的 功能 。 
3.4.1 插入 数据 
1. 插入 单个 元 组 
插入 语句 的 一 般 格式 为 : 
INSERT 


INTO < 表 名 > [(< 属 性 列 1 >[,< 属 性 列 2>,…]) 

VALUES(< 常 量 1 >[,< 常 量 2>]…); 

如 果 某 些 属 性 列 在 INTO 子 句 中 没有 出 现 , 则 新 记录 在 这 些 列 上 将 取 空 值 。 但 必须 注 
意 的 是 ,在 表 定 义 时 说 明了 NOT NULL 的 属性 列 不 能 取 空 值 ,否则 会 出 错 。 


如 果 INTO 子 句 中 没有 指明 任何 列 名 , 则 新 插入 的 记录 必须 在 每 个 属性 列 上 均 有 值 且 四 
新 插入 记录 的 属性 值 与 原 表 属 性 应 一 一 对 应 。 章 
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【 例 3-52】 将 一 个 新 学 生 记 录 ( 学 号 : 091530; 姓名 : 夏 雨 ; 性 别 : 男 ; 籍贯 : 海南 ; 出 
生年 份 : 1999; 学 院 : 计算 机 ) 插 入 学 生 表 中 。 

INSERT 

INTO 学 生 

VALUES ('091530'，' 夏 雨 "'，' 男 … ' 海 南 '，'1999', ' 计 算 机 '); 

子 查询 也 可 以 嵌 套 在 INSERT 语句 中 ,用 以 生成 要 插入 的 数据 。 其 功能 是 以 批量 插 
入 ,一 次 将 子 查询 的 结果 全 部 插入 指定 表 中 。 

2. 插入 子 查 询 结 果 

INSERT 

INTO ”< 表 名 > [(< 属 性 列 1 >[,< 属 性 列 2>, …)] 

子 查 询 ; 

【 例 3-53】 设 有 关系 模式 DEPT _ AGE (SDEPT ChAR (20), AVG _ AGE 
SMALLINT) ,表示 每 个 学 院 学 生 的 平均 年 龄 ,请 根据 学 生 表 中 的 数据 , 求 得 结果 后 存 人 数 
据 库 。 

INSERT 

INTO DEPT_AGE( SDEPT, AVG_AGE) 

SELECT 学 院 ，AVG(year(now()) - 出 生年 份 ) 


FROM 学 生 
GROUP BY 学 院 


3.4.2 删除 数据 
删除 语句 的 一 般 格式 为 : 


DELETE 

FROM < 表 名 > 

[ WHERE < 条 件 > ]; 

删除 可 以 分 为 如 下 几 种 。 

(1) 删除 某 个 ( 某 些 ) 元 组 的 值 : WHERE 子 句 中 给 出 删除 条 件 。 
(2) 删除 全 部 元 组 的 值 : 省 略 WHERE 子 句 。 

(3) 带子 查询 的 删除 语句 。 

【 例 3-54】 删除 学 号 为 092010 的 学 生 记录 。 


DELETE FROM 学 生 
WHERE 学 号 = '092010'; 


【 例 3-55】 删除 计算 机 学 院 所 有 学 生 的 选课 记录 。 


DELETE 
FROM 学 习 

WHERE ' 计 算 机 '= 

(SELECT 学 院 

FROM 学 生 

WHERE 学 生 .学 号 = 学 习 . 学 号 ); 


带 有 子 查询 的 删除 操作 ,执行 过 程 类 似 于 相关 子 查询 。 如 例 3-55 中 ,首先 考察 父 查询 
学 习 表 的 第 一 条 记录 , 取 其 学 号 值 放 到 子 查询 中 执行 ; 如 果 查 询 的 结果 为 “计算 机 ”, 使 得 父 
查询 中 WHERE 条 件 为 真 , 则 删除 当前 考察 的 这 条 记录 ; 接着 考察 学 习 表 中 的 第 二 条 记 
录 , 以 此 类 推 。 


3.4.3 修改 数据 
修改 操作 语句 的 一 般 格 式 为 : 


UPDATE ”< 表 名 > 

SET < 列 名 > = < 表达 式 > [，< 列 名 > = < 表达 式 >] … 

[WHERE < 条 件 > ]; 

其 功能 是 修改 指定 表 中 满足 WHERE 子 句 条 件 的 元 组 。 其 中 ,SET 子 句 用 于 指定 修改 
方法 , 即 用 表达 式 的 值 取 代 相 应 的 属性 列 值 。 如 果 省 略 WHERE 子 句 , 则 表示 要 修改 表 中 
的 所 有 元 组 。 

1. 更 新 表 中 的 一 个 元 组 

【 例 3-56】〗 将 091611 号 学 生 的 籍贯 改 为 江苏 。 

UPDATE ”学生 

SET 籍贯 = ' 江 苏 ' 

WHERE 学 号 = '091611'; 

2. 更 新 表 中 多 个 元 组 的 数据 

【 例 3-57】 将 180101 号 课程 的 成 绩 增加 一 分 。 

UPDATE 学习 

SET 成 绩 = 成 绩 +1 

WHERE 课程 号 = '180101'; 

3. 带子 查询 的 修改 

【 例 3-58】 将 计算 机 学 院 学 生 的 成 绩 清 零 。 

UPDATE 学 习 

SET 成 绩 =0 

WHERE “计算 机 '= 

(SELECT 学院 
FROM 学 生 
WHERE 学 生 .学 号 = 学 习 . 学 号 ); 

带 有 子 查询 的 修改 操作 ,执行 过 程 与 带子 查询 的 删除 操作 类 似 。 如 例 3-58 中 ,首先 考 
察 父 查询 学 习 表 的 第 一 条 记录 , 取 其 学 号 值 放 到 子 查询 中 执行 ; 如 果 查 询 的 结果 为 “计算 
机 ”, 使 得 父 查询 中 WHERE 条 件 为 真 , 则 将 当前 考察 的 这 条 记录 中 的 成 绩 修 改 为 零 ; 接着 
考察 学 习 表 中 的 第 二 条 记录 ,以 此 类 推 。 


3.5 视 图 


视图 是 从 一 个 或 几 个 基本 表 ( 或 视图 ) 导 出 的 表 , 因 此 是 一 种 非 标准 的 子 模式 概念 。 一 
个 用 户 可 以 定义 若干 个 视图 ,这样 ,用 户 的 外 模式 就 由 若干 基本 表 和 若干 视图 组 成 。 视 图 一 
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且 被 定义 ,就 可 以 对 它 查询 ,在 某 些 情况 下 甚至 可 以 修改 。 
3.5.1 建立 视图 
建立 视图 的 一 般 格式 为 : 


CRERTE “VIEW < 视图 名 >[ (< 列 名 >[,< 列 名 >]…)] 

AS < 子 查询 > 

[WITH CHECK OPTION]; 

DBMS 执行 CREATE VIEW 语句 时 只 是 把 视图 的 定义 存 人 数据 字典 ,并 不 执行 其 中 
的 子 查询 语句 。 所 以 数据 库 中 只 存放 视图 的 定义 ,而 不 存放 对 应 的 数据 ,这 也 是 视图 被 称 为 
虚 表 的 原因 。 

构成 视图 的 属性 列 或 者 全 部 省 略 ,或 者 全 部 给 出 ,没有 其 他 情况 。 如 果 全 部 省 略 ,构成 
视图 的 属性 列 由 子 查询 中 SELECT 子 句 中 的 诸 字段 确定 。 但 在 下 列 三 种 情况 下 必须 明确 
指定 组 成 视图 的 所 有 列 名 。 

(1) 某 个 目标 列 是 集 函 数 或 列表 达 式 ; 

(2) 多 表 连 接 时 选 出 了 几 个 同名 列 作为 视图 的 字段 ; 

(3) 需要 在 视图 中 为 某 个 列 启用 新 的 更 合适 的 名 字 。 

WITH CHECK OPTION 表示 对 视图 进行 插入 、 删 除 和 更 新 操作 时 要 保证 发 生变 动 的 
行 满足 视图 定义 中 的 谓词 条 件 ( 即 子 查询 中 的 条 件 表达 式 ) 。 

【 例 3-59】 建立 计算 机 学 院 学 生 的 视图 。 


CREATE VIEW CS_VIEW 

AS SELECT * 

FROM 学 生 

WHERE ”学院 = ' 计 算 机 '; 

该 语句 生成 一 个 名 为 CS_VIEW 的 视图 ,其 中 的 属性 列 与 学 生 表 中 的 属性 列 一 致 , 它 相 
当 于 基本 表 的 一 个 映像 ,只 有 在 运行 视图 的 时 候 , 才 会 得 到 数据 ,不 运行 时 ,视图 只 是 一 个 表 
的 模式 的 定义 。 

需要 注意 的 是 ,以 SELECT x 方式 创建 的 视图 可 扩充 性 差 , 应 尽 可 能 避免 。 原 因 在 于 
该 类 视图 (CS_VIEW) 中 的 属性 列 与 定义 视图 时 的 基本 表 ( 学 生 表 ) 中 的 属性 列 自动 形成 映 
射 关系 , 当 基 本 表 的 结构 发 生变 化 时 ,视图 (CS_VIEW) 与 基本 表 ( 学 生 表 ) 的 映射 关系 被 破 
坏 ,导致 该 类 视图 不 能 正确 工作 。 为 了 避免 出 现 这 类 问题 ,最 好 在 修改 基本 表 之 后 删除 由 其 
导出 的 视图 ,然后 重建 视图 ; 或 者 将 视图 的 建立 语句 改写 为 如 下 形式 。 

CREATE “VIEW CS_VIEW( 学 号 , 姓名 ,性别 , 籍贯 ， 出 生年 份 , 学 院 ) 

AS SELECT 学 号 , 姓名 ,性别 , 籍贯 ,出 生年 份 , 学 院 

FROM 学 生 

WHERE 学 院 = ' 计 算 机 '; 

(1) 视图 可 以 建立 在 多 个 表 上 。 

【 例 3-60】 建立 计算 机 学 院 选 修了 “数据 库 原 理 ” 这 门 课 的 学 生 的 视图 。 

CREATE VIEW DB S1 

RS 


SELECT 学生. 学 号 ,姓名 ,性 别 ,籍贯 ,学 院 ,成 绩 

FROM 学生, 学习, 课程 

WHERE 课程 名 = ' 数 据 库 原 理 ' 

AND 学生 .学 号 = 学 习 . 学 号 

AND ”课程 .课程 号 = 学习. 课程 号 

AND 学 院 = ' 计 算 机 '; 

(2) 视图 可 以 建立 在 其 他 的 视图 上 。 

【 例 3-61】 建立 计算 机 学 院 选修 “数据 库 原理 ”课程 且 成 绩 在 90 分 以 上 的 学 生 的 视图 。 

CREATE VIEW DB_S2 

AS 

SELECT * 

FROM DB_S1 

WHERE ”成绩 > = 90; 

定义 基本 表 时 ,为 了 减少 数据 库 中 的 元 余数 据 , 表 中 只 存放 基本 数据 ,由 基本 数据 经 过 
各 种 计算 派生 出 的 数据 一 般 是 不 存储 的 。 由 于 视图 中 的 数据 并 不 实际 存储 ,所 以 定义 视图 
时 可 以 根据 应 用 的 需要 ,设置 一 些 派 生 属性 列 。 这 些 派 生 属性 由 于 在 基本 表 中 并 不 实际 存 
在 ,所 以 有 时 也 称 它们 为 虚拟 列 。 带 虚拟 列 的 视图 称 为 带 表 达 式 的 视图 。 

【 例 3-62〗 定义 一 个 反映 学 生年 龄 的 视图 。 


CREATE VIEW BT_S( 学 号 , 姓名, 年龄) 


AS 
SELECT 学 号 , 姓名 ,year(now()) - 出生 年份 AS 年 龄 
FROM 学 生 ; 


3.5.2 删除 视图 
删除 视图 的 一 般 格式 为 : 


DROP VIEW < 视图 名 > 


一 个 视图 被 删除 后 ,由 此 视图 导出 的 其 他 视图 也 将 失效 ,用 户 应 该 使 用 DROP VIEW 
语句 将 它们 一 一 删除 。 


3.5.3 查询 视图 


视图 定义 后 ,用 户 就 可 以 像 对 基本 表 进 行 查询 一 样 对 视图 进行 查询 。DBMS 执行 对 视 
图 的 查询 时 ,首先 进行 有 效 性 检查 ,检查 查询 涉及 的 表 、 视 图 等 是 否 在 数据 库 中 存在 ,如 果 存 
在 , 则 从 数据 字典 中 取出 查询 涉及 的 视图 的 定义 ,把 定义 中 的 子 查询 和 用 户 对 视图 的 查询 结 
合 起 来 ,转换 成 对 基本 表 的 查询 ,然后 再 执行 这 个 经 过 修正 的 查询 。 将 对 视图 的 查询 转换 为 
对 基本 表 的 查询 的 过 程 称 为 视图 的 消解 (View Resolution ) 。 

【 例 3-63】 在 计算 机 学 院 学 生 的 视图 中 找 出 年 龄 小 于 20 岁 的 学 生 。 

SELECT * 


FROM CS_VIEW 
WHERE ”year(now()) 一 出 生年 份 <20; 


DBMS 执行 此 查询 时 .将 其 与 CS_VIEW 视图 定义 中 的 子 查询 
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CREATE VIEW CS_VIEW 
AS SELECT * 

FROM 学 生 

WHERE 学 院 = "计算 机 


结合 起 来 ,转换 成 对 基本 表 学 生 表 的 查询 ,消解 后 的 查询 语句 为 : 
SELECT * 


FROM 学 生 
WHERE 学院 = ' 计 算 机 ' AND year(now()) -出 生年 份 <20; 


3.5.4 更 新 视图 


更 新 视图 包括 插入 (INSERT) 删除 (DELETE) 和 修改 (UPDATE) 三 类 操作 。 并 非 所 
有 的 视图 都 允许 更 新 ,只 有 某 些 非常 简单 的 视图 ( 称 为 可 更 新 视图 ,Updatable View) ,在 把 
对 视图 的 更 新 操作 转换 为 对 基本 表 的 等 价 操作 后 ,允许 对 这 些 视 图 进行 更 新 。 

到 底 什 么 样 的 视图 是 可 更 新 的 ? 若 一 个 视图 是 从 单个 基本 表 导 出 的 ,并 且 只 是 去 掉 了 
某 些 行 和 列 (不 包括 关键 字 ) ,如 视图 CS_VIEW, 称 这 类 视图 为 行列 子 集 视图 。 目 前 ,关系 
系统 只 提供 对 行列 子 集 视图 的 更 新 ,并 具有 以 下 限制 。 

(1) 若 视 图 的 属性 来 自 属性 表达 式 或 常数 , 则 不 允许 对 视图 执行 INSERT 和 UPDATE 
操作 ,但 允许 执行 DELETE 操作 。 

(2) 若 视图 的 属性 来 自 库 函 数 , 则 不 允许 对 此 视图 更 新 。 

(3) 若 视图 定义 中 有 GROUP BY 子 句 , 则 不 允许 对 此 视图 更 新 。 

(4) 若 视图 定义 中 有 DISTINCT 选项 , 则 不 允许 对 此 视图 更 新 。 

(5) 若 视图 定义 中 有 嵌 套 查询 ,并 且 骨 套 查询 的 FROM 子 句 涉及 导出 该 视图 的 基本 
表 , 则 不 允许 对 此 视图 更 新 。 

(6) 若 视图 由 两 个 以 上 的 基本 表 导 出 , 则 不 允许 对 此 视图 更 新 。 

(7) 如 果 在 一 个 不 允许 更 新 的 视图 上 再 定义 一 个 视图 ,这 种 二 次 视图 是 不 允许 更 新 的 。 

【 例 3-64】 以 下 视图 的 更 新 就 是 不 允许 的 。 


CREATE ”VIEW GOOD S_C_VIEW 


RS 
SELECT 学 号 , 课程 号 , 成绩 
FROM 学 习 
WHERE 成 绩 > 
(SELECT AVG( 成 绩 ) 
FROM 学 习 ); 


3.6 数据 控制 


由 DBMS 提供 统一 的 数据 控制 功能 是 数据 库 系统 的 特点 之 一 。 数 据 控制 也 称 为 数据 
保护 ,包括 数据 的 安全 性 控制 完整 性 控制 .并 发 控制 和 恢复 。 这 里 主要 介绍 SQL 的 安全 控 
制 中 的 存 取 控 制 的 实现 ,其 他 详细 内 容 见 第 6 章 数据 库 保护 。 


3.6.1 授权 
SQL 用 GRANT 语句 向 用 户 授予 操作 权限 ,GRANT 语句 的 一 般 格式 为 : 


GRANT < 权限 >[,< 权 限 >] … 

[ON < 对 象 类 型 > < 对 象 名 >] 

[To < 用 户 >[,< 用 户 >]… 

[WITH GRANT OPTION] ; 

其 语义 为 : 将 对 指定 操作 对 象 的 指定 操作 权限 授予 指定 的 用 户 。 

对 不 同类 型 的 操作 对 象 有 不 同 的 操作 权限 ,常见 的 操作 权限 如 表 3-39 所 示 。 


表 3-39 不 同 对 象 类 型 允许 的 操作 权限 


对 象 对 象 类 型 操作 权 限 

属性 列 TABLE SELECT,INSERT,UPDATE,DELETE,ALL PRIVILEGES 

视图 TABLE SELECT,INSERT,UPDATE,DELETE,ALL PRIVILEGES 

基本 表 TABLE SELECT,INSERT,UPDATE ,DELETE ALTER, INDEX,ALL PRIVILEGES 


数据 库 DATABASE CREATETAB 


接受 权限 的 用 户 可 以 是 一 个 或 多 个 具体 用 户 , 也 可 以 是 PUBLIC 即 全 体 用 户 。 如 果 指 
定 了 WITH GRANT OPTION 子 句 , 则 获得 某 种 权限 的 用 户 还 可 以 把 这 种 权限 再 授予 别 
的 用 户 。 如 果 没 有 指定 WITH GRANT OPTION 子 句 , 则 获得 某 种 权限 的 用 户 只 能 使 用 
该 权限 ,但 不 能 传播 该 权限 。 

【 例 3-65】 把 学 生 表 的 查询 权限 授予 用 户 Userl 。 


GRANT SELECT ON TABLE 学 生 TO Userl; 

【 例 3-66】 把 学 生 表 和 课程 表 的 全 部 权限 授予 用 户 User2 和 User3。 
GRANT ALL PRIVILEGES ON TABLE 学 生 , 课程 TO User2, User3; 

【 例 3-67】 把 学 习 表 的 查询 权限 授予 全 部 用 户 。 

GRANT SELECT ON TABLE 学 习 TO PUBLIC; 

【 例 3-68】 把 查询 学 习 表 和 修改 成 绩 的 权限 授 给 用 户 User4。 

GRANT UPDRTE (成 绩 ) ，SELECT ON TABLE 学 习 TO User4; 


【 例 3-69】 把 学 生 表 的 INSERT 权限 授予 User5 用 户 ,并 人 允许 他 再 将 此 权限 授予 其 他 
用 户 < 


GRANT INSERT ON TABLE 学 生 TO User5 WITH GRANT OPTION; 
3.6.2 收回 权限 

授予 的 权限 可 以 由 DBA 或 其 他 授权 者 用 REVOKE 语句 收回 ,REVOKE 语句 的 一 般 
格式 为 : 


REVOKE < 权限 >[ ,< 权限 >] … 
[ON < 对 象 类 型 > < 对 象 名 >] 
[FROM < 用 户 >[,< 用 户 >] … 


【 例 3-70】 把 用 户 User4 修改 成 绩 的 权限 收回 。 


REVOKE ”UPDATE( 成绩 ) ON TABLE 学 习 FROM User4; 


击 刷 泪 
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【 例 3-71】 把 用 户 User5 对 学 生 表 的 INSERT 权限 收回 。 
REVOKE INSERT ON TABLE 学 生 FROM User5; 


在 例 3-69 中 ,用 户 User5 获得 了 学 生 表 的 INSERT 权限 ,并 且 可 以 将 该 权限 授予 其 他 
用 户 。 若 User5 将 该 权限 授予 了 User6 ,执行 此 REVOKE 语句 后 ,DBMS 在 收回 User5 对 
学 生 表 的 INSERT 权限 的 同时 ,还 会 自动 收回 User6 对 学 生 表 的 INSERT 权限 , 即 收回 权 
限 的 操作 会 级 联 下 去 。 但 如 果 User6 还 从 其 他 用 户 处 获得 对 学 生 表 的 INSERT 权限 , 则 他 
仍 具 有 此 权限 ,系统 只 收回 直接 或 间接 从 User5 处 获得 的 权限 。 


小 结 


SQL 是 关系 数据 库 的 标准 语言 ,已 经 广泛 应 用 在 商务 系统 中 。SQL 主要 由 数据 定义 、 
数据 操作 .数据 控制 语句 组 成 。 

SQL 的 数据 定义 部 分 包括 对 SQL 基本 表 、 视 图 .索引 的 创建 和 撤销 。 

SQL 的 数据 操作 分 成 数据 查询 和 数据 更 新 两 部 分 。 

SQL 的 数据 查询 用 SELECT 语句 实现 , 兼 有 关系 代数 和 元 组 演算 的 特点 。 查 询 的 类 
型 有 单 表 查询 .连接 查询 和 蔗 套 查询 ,同时 介绍 了 聚集 函数 、 分 组 子 句 和 排序 子 句 的 使 用 
方法 5 

SQL 的 数据 更 新 包括 数据 的 插入 、 删 除 和 修改 三 种 操作 。 

SQL 中 的 视图 是 一 个 虚 表 ,只 给 出 了 结构 的 定义 ,并 不 存储 数据 。 本 章 主 要 介绍 了 视 
图 的 定义 、 查 询 和 更 新 操作 ,其 中 ,只 有 行列 子 视图 才 允 许 进 行 更 新 。 


习 题 3 


3.1 试 述 SQL 的 特点 。 

3.2 解释 下 列 术语 : 

SQL 模式 ”基本 表 视图 单 表 查 询 连接 查询 铸 套 查询 

3.3 试 述 SQL 的 特点 。 

3.4 试 述 SQL 体系 结构 和 关系 数据 库 模 式 之 间 的 关系 。 

3.5 SQL 是 如 何 实 现实 体 完 整 性 .参照 完整 性 和 用 户 定义 完整 性 的 ? 

3.6 讨论 当 对 一 个 视图 进行 更 新 的 时 候 可 能 会 出 现 什 么 样 的 问题 。 

3.7 设 有 两 个 基本 表 R(A,B,C) 和 SCA,B,C) ,试用 SQL 查询 语句 表达 下 列 关 系 代 
数 表达 式 : 

(1) RMS (2) R—S (RUS (4) RxS 

3.8 对 于 教学 数据 库 的 三 个 基本 表 : 

S( 学 号 ,姓名 ,年 龄 ,性 别 ) 

SC( 学 号 ,课程 号 ,成 绩 ) 

C( 课 程 号 ,课程 名 ,任课 教师 姓名 ) 

试用 SQL 语句 表达 下 列 查询 。 


(1) 查询 姓 刘 的 老师 所 授课 程 的 课程 号 和 课程 名 。 

(2) 查询 年 龄 大 于 23 岁 的 男 同学 的 学 号 和 姓名 。 

(3) 查询 学 号 为 S3 的 学 生 所 学 课程 的 课程 号 ,课程 名 和 任课 教师 姓名 。 

(4) 查询 “ 张 小 飞 ”没有 选修 的 课程 号 和 课程 名 。 

(5) 查询 至 少 选修 了 三 门 课程 的 学 生 的 学 号 和 姓名 。 

(6) 查询 全 部 学 生 都 选修 了 的 课程 编号 和 课程 名 称 。 

(7) 在 SC 中 删除 尚 无 成 绩 的 选课 元 组 。 

(8) 把 “高 等 数学 ” 课 的 所 有 不 及 格 成 绩 都 改 为 60 。 

(9) 把 低 于 总 平均 成 绩 的 女 同 学 的 成 绩 提高 5%% 。 

(10) 向 C 中 插入 元 组 (‘C8”, “VC++’,' 王 昆 ?)。 

3.9 设 有 下 列 4 个 关系 模式 : 

PRODUCT( MAKER, MODEL, TYPE) 

PC( MODEL, SPEED, RAM, HD, CD, PRICE) 

LAPTOP( MODEL, SPEED, RAM, SCREEN, PRICE) 

PRINTER( MODEL, COLOR, TYPE, PRICE) 

注 : PRODUCT 表 中 TYPE 属性 列 的 取 值 为 pc 或 laptop 或 printer; PRINTER 表 中 
color 属性 列 的 取 值 为 true 或 false, 代 表 彩 色 或 单 色 。 

试用 SQL 语句 表达 下 列 查询 。 

(1) 找 出 价格 高 于 15000 元 ,并 且 运 行 速度 低 于 同 价位 PC 的 平均 运行 速度 的 
LAPTOP。 

(2) 找 出 生产 价格 最 低 的 彩色 打印 机 的 厂家 。 

(3) 计算 由 厂家 “HP” 生 产 的 PC 和 LAPTOP 的 平均 价格 。 

(4) 计算 各 厂商 所 生产 的 LAPTOP 的 显示 器 的 平均 尺寸 。 

(5) 找 出 每 一 个 生产 厂商 的 PC 的 最 高 价格 。 

(6) 计算 生产 打印 机 的 各 个 厂商 所 生产 的 PC 的 硬盘 的 平均 容量 。 

3.10” 试 设计 如 图 3-2 所 示 的 数据 库 模式 Library, 用 来 记录 书籍 、 借 书 人 和 书籍 借 出 
的 情况 ,参照 完整 性 在 图 中 用 有 向 弧 来 表示 。 请 用 SQL 建立 图 中 的 关系 模式 ,并 完成 下 列 


操作 。 
BookID Author 
BookID Title PublisherName 
Name Address Phone 


| BookID | CardID | DateOut | DueOut 


CardID Name Address Phone 


图 3-2 Library 数据 库 模式 


关系 数据 亩 标准 语言 SQL 
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(1) 查询 “清华 大 学 出 版 社 ” 出 版 的 所 有 图 书 名 称 和 编号 。 

(2) 查询 所 有 作者 是 “ 郭 雨 展 ” 的 图 书 的 编号 和 名 称 。 

(3) 查询 “ 王 丽 ” 借 过 的 所 有 图 书 的 名 称 。 

(4) 查询 “ 李 明 ” 在 2018 年 上 半年 期 间 借 过 的 图 书 名 称 。 

(5) 建立 视图 ,显示 2017 年 期 间 没有 被 人 借 过 的 图 书 编号 和 名 称 。 

(6) 建立 超期 未 归还 书籍 的 视图 ,显示 图 书 编号 和 名 称 ,以 及 借 书 人 的 姓名 和 电话 。 

(7) 建立 热门 书籍 的 视图 ,显示 2017 年 期 间 借 出 次 数 最 多 的 10 本 图 书 名 称 。 

(8) 增加 新 书 ( 大 数据 》, 书 号 为 “TP319-201”, 该 书 由 “广西 师范 大 学 出 版 社 ” 出 版 ,作者 
为 “ 涂 子 沛 ”。 

(9) 将 “清华 大 学 出 版 社 ” 的 电话 改 为 “010-62770278”。 

(10) 删除 书号 为 “D001701” 的 书籍 信息 。 

3.11 针对 3.8 建立 的 表 , 用 SQL 完成 下 列 操作 。 

(1) 把 对 所 有 表 的 INSERT 权限 授予 “ 张 丽 ”, 并 允许 她 将 此 权限 授予 其 他 用 户 ; 

(2) 把 查询 和 修改 BORROWER 的 权限 受 给 用 户 “ 王 伟 ”。 


第 4 章 关系 规范 化 理论 


关系 是 一 个 二 维 表 , 通 过 关系 模式 来 描述 其 人 逻辑 结构 ; 而 关系 数据 库 是 由 一 组 关系 组 
成 ,这 些 关 系 模式 的 集合 构成 了 数据 库 模式 , 即 数据 库 的 逻辑 结构 。 但 是 构造 一 个 合适 的 数 
据 库 模式 这 个 问题 在 数据 库 设 计 中 是 极其 重要 而 又 基本 的 问题 ,至 今 尚未 提 及 。 
因此 ,在 分 析 和 设计 数据 库 的 逻辑 结构 之 前 ,首先 必须 搞 清 楚 什 么 是 “好 的 ?关系 模式 ， 
如 何 衡 量 一 个 关系 模式 的 “好 坏 ”, 如 何 把 一 个 “不 好 ”的 关系 模式 改造 成 “好 的 "关系 模式 。 
关于 这 个 问题 的 长 期 研究 和 讨论 ,形成 了 一 系列 完整 的 理论 和 方法 , 称 为 关系 规范 化 理论 。 
这 也 是 关系 数据 理论 的 创始 人 E. F. Codd 的 重要 贡献 之 一 。 

本 章 共 4 节 ,4. 1 节 通 过 实例 阐述 为 什么 要 对 关系 数据 模型 进行 规范 化 ; 4.2 节 和 4.3 
节 介 绍 函 数 依赖 的 概念 及 相关 理论 ,构建 关系 模式 分 解 的 理论 基础 ; 4. 4 节 讨 论 关系 模式 
的 分 解 方 法 。 


4.1 问题 的 提出 


一 个 “不 好 ?的 关系 模式 ,究竟 不 好 在 什么 地 方 ? 由 什么 原因 引起 ? 如 何 处 理 : 

本 节 通 过 一 个 实例 说 明 : 如 果 数 据 库 模式 设计 不 当 , 就 会 出 现 数据 元 余 ; 有 了 数据 元 
余 , 就 可 能 产生 操作 异常 。 关 系 规范 化 问题 产生 的 背景 就 是 需要 处 理 数 据 元 余 以 及 由 此 带 
来 的 操作 异常 现象 。 为 了 解决 这 些 问 题 ,关系 规范 化 理论 引入 了 数据 依赖 的 概念 ,例如 , 函 
数 依赖 、 多 值 依赖 和 连接 依赖 等 ,建立 了 关系 模式 满足 的 数据 依赖 的 约束 级 别 , 即 范式 理论 ， 
以 及 进行 数据 依赖 关系 推理 和 演绎 的 Armstrong 公理 系统 。 


4.1.1 一 个 泛 关 系 模 式 的 实例 


理论 上 ,如 果 把 现实 问题 的 所 有 属性 组 合成 一 个 关系 模式 RCU) , 则 这 个 关系 模式 就 称 
为 泛 关系 模式 。 例 4-1 所 示 的 关系 模式 S_D_P 就 是 一 个 泛 关 系 模式 。 

【 例 4-1】 学 校 要 建立 一 个 研究 生 管理 系统 ,包含 的 对 象 有 : 研究 生 的 学 号 、 姓 名 、 学 院 
名 称 、 院 长 \ 项 目 编号 ,项 目 名 称 、 承 担任 务 、 导 师 姓 名 。 根 据 实际 情况 ,可 以 得 到 以 下 一 些 
事实 。 

(1) 学 院 中 包含 若干 名 研究 生 , 某 个 研究 生 只 能 属于 固定 的 一 个 学 院 ; 

(2) 学 院 的 院 长 是 主要 负责 人 且 只 有 一 个 ; 

(3) 每 个 研究 生 可 以 承担 多 个 项 目 . 每 个 项 目 可 以 由 多 个 研究 生 共同 参与 ,研究 生 选 定 
项 目 后 要 承担 相应 的 任务 ; 

(4) 每 个 研究 生 只 能 选择 一 个 导师 ,一 个 导师 可 以 带 若干 名 研究 生 。 
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根据 以 上 分 析 的 结果 ,可 以 得 到 属性 集 U 和 属性 之 间 的 依赖 关系 图 ,如 图 4-1 所 示 。 


0= {学 号 ,姓名 ,学 院 名 称 , 院 长 ,项 目 编号 ,项 目 名 称 , 承担 任务 ,导师 姓名 } 


导师 姓名 | | 姓名 | 项 目 名 称 
~、 4 下 
学 号 | 。 | 项 上 编 | 上 -| 承担 任务 


是 
学 院 名 称 


4-1 研究 生 管理 系统 数据 依赖 图 


图 4-1 相关 说 明 如 下 。 
(1) 如 果 研 究 生 的 学 号 确定 , 则 研究 生 的 姓名 及 其 导师 的 姓名 就 可 以 确定 。 
(2) 如 果 研 究 生 的 学 号 确定 , 则 该 研究 生 所 在 的 学 院 就 可 以 确定 。 
(3) 如 果 学 院 名 称 确定 , 则 院 长 就 可 以 确定 。 
(4) 如 果 项 目 编号 确定 , 则 项 目 名 称 就 可 以 确定 。 
(5) 如 果 研 究 生 的 学 号 和 其 承担 的 项 目 编号 都 确定 时 , 则 该 研究 生 在 项 目 中 承担 的 任 
务 就 可 以 确定 。 
可 以 看 出 ,学 号 和 项 目 编号 组 合 起 来 可 以 唯一 地 标识 一 个 元 组 ,是 关系 的 主 码 。 若 将 所 
有 属性 放 在 一 个 关系 模式 中 , 则 得 到 泛 关 系 模式 S_D_P。 对 于 泛 关系 模式 S_D_P, 它 的 一 
个 具体 实例 如 表 4-1 所 示 。 


院 长 


表 4-1 关系 模式 S_D_P 


学 号 | 姓名 | 学 院 名 称 | 院 长 | 项 目 编号 项 目 名 称 承担 任务 | 导师 姓名 
20182401 | 周 黎明 | 计算 机 学 院 | 李 洲 彤 0042 提升 机 稳定 性 研究 实验 分 析 | 贺信 维 
20182402 | 李 毅 先 | 计算 机 学 院 | 李 洲 彤 0042 提升 机 稳定 性 研究 系统 设计 | 张 琦 
20182402 | 李 毅 先 | 计算 机 学 院 | 李 洲 彤 0052 多 维 数据 分 析 研 究 软件 编码 | 萨 林 
20183401 | 王 狗 饮 | 数学 学 院 吴 兆 民 0091 定理 证 明 自 动 化 研究 | 软件 编码 | 刘 玉 酚 
20183402 | 何 飞 雨 | 数学 学 院 吴 兆 民 0083 “| 最 大 入 原 理 研究 软件 编码 | 刘 玉 酚 


针对 表 4-1 的 关系 ,详细 分 析 其 关系 模式 S_D_P, 不 难 发 现 , 有 如 下 缺点 。 


首先 ,元 余 度 大 。 
(1) 项 目 编号 确定 , 则 项 目 名 称 就 可 以 确定 。 也 就 是 说 ,对 每 个 学 生 , 只 要 知道 他 所 参 


与 的 项 目 编号 ,自然 就 知道 了 项 目 名 称 。 因 此 ,“ 


项 目 名 称 ” 被 重复 存储 了 。 同 样 的 道理 , 知 


道 研究 生 的 学 号 , 则 研究 生 姓名 、 导 师 姓名 、 学 院 名 称 自然 确定 ,因此 ,这 些 属性 也 被 重复 存 
储 了 。 这 些 都 说 明 ,该 模式 存在 不 合理 的 “数据 元 余 ”。 
(2) 同一 个 学 院 有 多 名 研究 生 。 如 果 研 究 生 的 学 号 确定 , 则 该 研究 生 所 在 的 学 院 就 确 


定 , 如 果 所 在 学 院 确定 , 则 该 学 院 的 院 长 也 就 确定 。 很 明显 ,这 里 对 每 个 学 生 都 好 


录 了 “ 院 长 ”, 也 导致 该 模式 存在 不 合理 的 “数据 元 余 ”。 


其 次 ,存在 以 下 三 类 操作 异常 。 


复元 余 记 


(1) 由 于 S_D_P 关 系 模式 的 主 码 是 (学 号 ,项 目 编号 ) ,所 以 ,如 果 新 生 人 学 时 还 没有 承 
担 项 目 , 根 据 实体 完整 性 规则 ,他 们 的 个 人 信息 就 会 由 于 缺少 主 码 中 的 主 属性 “项 目 编号 ?而 
无 法 插入 到 关系 S_D_P 中 :; 同样 地 ,一 个 新 项 目 , 还 没有 研究 生 参 与 进来 ,也 无 法 插入 到 关 
系 S_D_P 中 。 也 就 是 说 存在 着 “插入 异常 ”的 问题 。 

(2) 假设 学 生 在 毕业 离 校 时 ,要 删除 他 们 的 信息 ,在 删除 这 些 学 生 信息 的 同时 ,连同 某 
些 项 目 信息 也 删除 掉 了 ,会 导致 某 些 项 目 不 存在 的 假象 ; 类 似 地 , 某 些 项 目 已 经 完成 ,删除 
时 也 可 能 会 导致 学 生 信息 的 丢失 ,产生 “删除 异常 ”现象 。 

(3) 由 于 存在 着 不 该 有 的 数据 元 余 的 问题 ,所 以 如 果 某 个 学 院 的 院 长 更 换 , 那 么 这 个 学 
院 的 所 有 学 生 对 应 的 “ 院 长 ”属性 值 都 要 进行 更 新 ,即便 有 一 个 遗漏 ,也 会 造成 数据 的 不 一 致 
现象 。 类 似 地 ,研究 生 姓名 、 导 师 姓名 、 学 院 名 称 这 些 属性 在 更 新 时 也 存在 同样 的 问题 ,所 
以 ,S_D_P 关 系 模式 还 存在 着 “更 新 异常 "的 问题 。 


4.1.2 改造 泛 关 系 模式 SD _P 


以 上 讨论 说 明 , 关 系 模式 S_D_P 是 一 个 “不 好 ”的 设计 ,存在 数据 元 余 、 插 入 、 删 除 、 更 新 
异常 等 问题 。 改 造 的 办 法 是 把 关系 模式 S_D_P 分 解 成 多 个 关系 模式 ,并 期 望 在 分 解 后 的 每 
个 关系 模式 中 消除 上 述 不 好 的 现象 。 以 下 是 4 种 不 同 的 分 解 方法 得 到 的 设计 结果 。 

(1) 第 一 种 分 解 方法 : 消除 第 一 类 宛 余 。 

S_D( 学 号 ,学 生 姓 名 ,学 院 名 称 , 院 长 ,导师 姓名 ) 

P( 项 目 编号 ,项 目 名 称 ) 

S_P( 学 号 ,项 目 编号 ,承担 任务 ) 

分 析 : 这 种 分 解 方 法 得 到 的 关系 模式 将 描述 研究 生 的 信息 放 在 S_D 模式 中 ,描述 项 目 
的 信息 放 在 P 模式 中 ,描述 研究 生 承 担 项 目的 信息 放 在 S_P 模式 中 ,各 模式 的 数据 依赖 如 
图 4-2 所 示 ,其 优点 和 缺点 如 下 。 


导师 姓 名 
项 目 编号 “| -| 珊 目 多 


入 
J 


项 目 编号 [一 | ”承担 任务 


院 长 [< 一 学 院 名 称 


4-2 分 解 一 的 数据 依赖 图 


优点 : 消除 掉 “ 项 目 名 称 “ 研 究 生 姓名 ”导师 姓名 ”学 院 名 称 ” 这 些 属性 的 元 余 存 储 。 
同时 ,由 于 宛 余 的 消除 ,也 解决 了 学 生 和 项 目 信息 的 “更 新 异常 ”。 此 外 ,即使 是 没有 承担 项 
目的 新 研究 生 或 者 没有 分 配给 研究 生 的 新 项 目 , 两 者 的 信息 都 可 以 独立 地 插入 到 对 应 的 关 
系 模式 中 ; 同时 ,研究 生 信 息 的 删除 和 项 目 信息 的 删除 也 都 不 会 相互 影响 ,解决 了 此 类 的 
“插入 异常 "和 “删除 异常 ”问题 。 

缺点 : 由 于 在 关系 模式 S_D 中 ,还 包含 学 院 的 相关 信息 (学 院 及 院 长 ), 因 此“ 学院” 这 个 
相对 独立 的 实体 不 得 不 依附 于 “学 号 "这 个 主 码 , 由 此 所 带 来 的 数据 元 余 和 操作 异常 问题 仍 
没有 得 到 解决 。 


关系 规范 化 理论 


击 全 沽 
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(2) 第 二 种 分 解 方法 : 消除 掉 第 一 类 和 第 二 类 元 余 , 但 丢失 数据 依赖 关系 。 


S( 学 号 ,学 生 姓名 ,学 院 名 称 , 导 师 姓 名 ) 
B( 项 目 编号 ,项 目 名 称 ) 
S_MN( 学 号 , 院 长 ) 

S_P( 学 号 ,项 目 编号 ,承担 任务 ) 


分 析 : 各 模式 的 数据 依赖 如 图 4-3 所 示 。 这 种 分 解 方法 的 优点 和 缺点 如 下 。 


姓名 | | 学 院 名 称 学 号 “| -| 院 长 

1 

项 目 编号 ”| 一 =| ”项 目 名 称 

学 号 

1 a | 

导师 姓名 学 号 项 目 编号 承担 任务 


4-3 分 解 二 的 数据 依赖 图 


优点 : 和 方法 一 分 解 的 优点 相同 。 

缺点 : 为 了 解决 第 一 种 分 解 的 缺点 ,这 种 分 解 方法 将 院 长 信息 和 学 号 放 在 S_MN 模式 
中 ,虽然 可 以 查找 到 某 个 研究 生 所 在 的 学 院 及 其 院 长 信息 ,但 是 从 S 和 S_MN 两 个 关系 模 
式 中 只 能 得 到 * 学 号 可 以 决定 学 院 名 称 ” 和 * 学 号 可 以 决定 院 长 "两 个 依赖 关系 ,而 作为 描述 
“学 院 ” 信 息 的 院 长 不 应 该 依赖 于 研究 生 的 学 号 ,而 应 该 直接 依赖 于 学 院 名 称 , 所 以 这 种 分 解 
等 于 丢失 了 原 模 式 中 数据 之 间 应 有 的 依赖 关系 ,自然 会 存在 操作 异常 的 问题 ,如 新 成 立 了 一 
个 学 院 , 虽 然 已 经 分 配 了 院 长 但 还 没有 招收 学 生 , 则 这 个 学 院 的 信息 就 不 能 插入 到 S 和 S_ 
MN 两 个 关系 模式 中 。 

(3) 第 三 种 分 解 方法 : 消除 掉 第 一 类 和 第 二 类 宛 余 , 但 丢失 了 信息 。 

S( 学 号 ,学 生 姓 名 ,学 院 名 称 , 导 师 姓 名 ) 

P( 项 目 编号 ,项 目 名 称 ) 

D( 学 院 名 称 , 院 长 ) 

T( 承 担任 务 ) 

分 析 : 这 种 分 解 方法 得 到 的 关系 模式 将 描述 研究 生 的 信息 放 在 S 模式 中 ,描述 项 目的 
信息 放 在 P 模 式 中 ,描述 学 院 的 信息 放 在 DD 模式 中 ,各 模式 的 数据 依赖 如 图 4-4 所 示 。 其 优 
点 是 解决 了 数据 元 余 和 操作 异常 问题 。 


姓名 | | 学 院 名 称 | [学 院 名 称 | 一 =| 院 长 | 


t 
项 目 编号 “| ~| 。 项目 名 称 


学 号 


1 
导师 姓名 承担 任务 


图 4-4 分 解 三 的 数据 依赖 图 


缺点 : 由 于 工 模式 中 只 包含 承担 任务 , 若 要 回答 * 某 个 研究 生 在 某 个 项 目 中 承担 了 什么 
任务 ”这 类 问题 ,必须 通过 SP 和 T 了 三 个 模式 的 笛 卡 儿 积 运算 才能 获得 ,而 笛 卡 儿 积 运算 的 


结果 使 得 元 组 数 增加 了 ,这 些 增加 的 元 组 出 现在 查询 的 结果 中 ,也 就 等 于 丢失 了 原 模式 中 的 
相关 信息 。 

(4) 第 四 种 分 解 方法 。 消除 第 一 类 和 第 二 类 宛 余 , 保 持 数据 依赖 ,保证 信息 不 丢失 。 

S( 学 号 ,学 生 姓名 ,学 院 名 称 、 导 师 姓名 ) 

P( 项 目 编号 ,项 目 名 称 ) 

D( 学 院 名 称 , 院 长 ) 

S_P( 学 号 ,项 目 编号 ,承担 任务 ) 

分 析 : 这 种 分 解 将 “研究 生 … 学 院 … 项 目 " 和 “研究 生 承 担 项 目 ”等 实体 的 属性 分 别 放 在 
独立 的 关系 模式 中 ,解决 了 数据 宛 余 和 操作 异常 问题 ; 同时 ,各 分 解 后 的 子 模式 都 可 以 通过 
自然 连接 运算 恢复 到 原来 的 关系 模式 S_D_P, 并 且 S_D_P 中 的 所 有 数据 依赖 关系 在 分 解 后 
的 各 子 模式 中 都 得 到 了 保留 ,如 图 4-5 所 示 。 因 此 ,可 以 认为 这 是 一 种 “最 优 "的 分 解 方式 。 


姓名 | | 学 院 名 称 学 院 名 称 | “| 院 长 
二 六 项 目 编号 ”| 一 | 。 项 目 名 称 


学 号 | [ 项 目 编号 | 上 一 |。 承担 任务 


1 
导师 姓名 


4-5 分 解 四 的 数据 依赖 图 


4.1.3 存在 问题 的 原因 


例 4-1 表明 ,一 个 不 好 的 设计 存在 数据 元 余 及 操作 异常 的 问题 。 到 底 是 什么 原因 引起 
的 ? 对 这 个 问题 需要 从 语义 方面 进行 分 析 。 

如 第 1 章 所 述 , 事 物 之 间 是 互相 联系 .互相 制约 的 ,而 事物 本 身 内 部 的 各 个 属性 之 间 也 
是 互相 联系 、 互 相 制约 的 。 例 如 ,一 个 学 生 所 学 的 专业 依赖 于 学 生 的 学 号 。 属 性 之 间 的 这 种 
依赖 关系 表达 了 一 定 的 语义 信息 。 在 设计 数据 库 时 , 既 要 考虑 事物 之 间 的 联系 ,也 要 考虑 事 
物 内 部 的 联系 。 数 据 模型 描述 的 是 事物 之 间 的 联系 ,而 没有 充分 考虑 到 属性 之 间 的 联系 。 
对 于 例 4-1, 研 究 生 的 姓名 、 学 院 名 称 . 导 师 姓 名 都 依赖 于 学 号 ,但 与 研究 生 所 参与 的 科研 项 
目的 项 目 编号 、 项 目 名 称 及 承担 任务 没有 什么 联系 。 然 而 泛 关 系 模式 没有 按照 客观 世界 的 
“本 来 面目 "去 考虑 ,而 是 为 了 方便 ,把 不 相干 的 科研 项 目 信息 与 研究 生 信息 拼凑 在 一 起 , 导 
致 数据 元 余 及 操作 异常 的 发 生 。 

在 关系 数据 库 中 ,数据 之 间 的 联系 表现 为 同一 关系 模式 中 各 个 属性 之 间 的 依赖 关系 , 称 
为 数据 依赖 。 关 系 系统 中 ,数据 元 余 和 操作 异常 产生 的 重要 原因 就 是 对 数据 依赖 的 不 恰当 
处 理 ,最 终 导致 不 合理 的 关系 模式 的 设计 。 如 果 在 设计 和 构造 关系 模式 时 ,不 从 语义 上 研究 
和 考虑 属性 子 集 间 的 这 种 关联 ,简单 地 将 有 关联 的 和 无 关联 的 、 关 联 密切 的 和 关联 松散 的 、 
具有 这 种 关联 的 和 具有 另 一 种 关联 的 属性 随意 地 编排 在 一 起 .形成 泛 关 系 模式 ,就 可 能 产生 
很 大 程度 的 数据 元 余 , 导 致 “排他 ”现象 ,从 而 引发 各 种 冲突 和 异常 。 事 实 上 ,有 些 属性 关联 
本 来 可 以 作为 独立 的 关系 存在 ,但 却 有 可 能 不 得 不 依附 其 他 关系 而 存在 。 这 是 关系 结构 本 
身 带 来 的 限制 ,不 是 现实 世界 真实 情况 的 正确 反映 。 
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解决 问题 的 方法 就 是 将 关系 模式 进一步 分 解 , 即 将 关系 模式 中 的 属性 按照 一 定 的 约束 
条 件 重 新 分 组 ,争取 “一 个 关系 模式 只 描述 一 个 独立 的 实体 ”, 使 得 逻辑 上 独立 的 信息 放 在 独 
立 的 关系 模式 中 , 即 进行 关系 模式 的 规范 化 处 理 。 

数据 依赖 对 关系 模式 的 设计 起 着 举足轻重 的 作用 。 因 此 ,在 对 关系 模式 进行 分 解 的 过 
程 中 , 即 对 关系 实施 规范 化 处 理 时 ,必须 要 保持 其 原 有 的 数据 依赖 关系 ,否则 分 解 后 的 关系 
模式 仍 可 能 因为 依赖 关系 的 丢失 而 造成 数据 元 余 和 操作 异常 问题 。 


4.1.4 规范 化 理论 的 提出 


由 例 4-1 可 知 ,关系 数据 库 设 计 的 结果 方案 可 能 有 多 个 ,这 些 设计 方案 中 有 些 是 “好 ” 
的 ,有 些 是 “不 好 ”的 。 一 个 “好 ”的 方案 是 指 它 的 每 个 关系 中 的 属性 一 定 要 满足 某 种 内 在 的 
语义 联系 。 这 种 语义 联系 ,又 可 按 设计 关系 的 不 同 要 求 分 为 若干 等 级 ,这 叫 作 关 系 的 规范 化 
(Normalization)。 即 在 设计 关系 数据 库 模式 时 ,如 果 能 够 按照 规范 化 要 求 构造 每 一 个 关 
系 , 就 能 得 到 一 个 好 的 或 者 较 好 的 数据 库 模 式 。 

通过 上 述 针 对 一 个 泛 关系 模式 实例 的 分 析 和 改造 实践 可 以 知道 ,在 关系 数据 库 的 设计 
中 ,不 是 随便 一 种 关系 模式 的 设计 方案 都 是 “合适 ”的 ,更 不 是 任何 一 种 关系 模式 都 满足 实际 
应 用 环境 的 需要 。 由 于 数据 库 中 的 每 一 个 关系 模式 的 属性 之 间 需 要 满足 某 种 内 在 的 必然 联 
系 , 因 此 ,设计 一 个 好 的 数据 库 模 式 的 根本 方法 就 是 首先 要 分 析 和 掌握 属性 间 的 语义 关联 ， 
然后 再 依据 这 些 关 联 得 到 相应 的 设计 方案 。 

“关系 规范 化 "理论 包含 两 个 核心 的 问题 : 四 如 何 判断 关系 模式 中 存在 的 问题 。 通 过 分 
析 关 系 模式 中 的 数据 依赖 关系 ,判断 关系 模式 的 “范式 ”级 别 ,从 而 得 到 这 种 模式 中 可 能 存在 
的 数据 元 余 和 操作 异常 问题 。@ 如 何 解 决 关 系 模式 中 存在 的 问题 , 即 对 关系 模式 进行 分 解 。 
从 例 4-1 可 以 看 到 ,分 解 的 方法 很 多 ,但 不 是 所 有 的 分 解 都 是 “最 优 的 "。 分 解 过 程 必须 考虑 
“满足 一 定 级 别 的 范式 “保持 原 模式 中 的 信息 “保持 原 模式 中 的 函数 依赖 "等 问题 ,而 "关系 
规范 化 ”理论 为 解决 这 些 问 题 提供 了 理论 依据 和 相应 的 算法 。 

综合 以 上 分 析 , 规 范 化 理论 为 优化 数据 库 设计 提供 了 坚实 的 理论 基础 ,因此 是 进行 数据 
库 设 计 所 必须 掌握 的 一 个 重要 环节 。 下 面 介 绍 最 重要 的 一 种 数据 依赖 关系 一 一 函数 依赖 ， 
以 及 建立 在 函数 依赖 基础 之 上 的 多 级 范式 的 概念 。 


4.2 函数 依赖 和 范式 


函数 依赖 是 最 为 常见 和 最 为 基本 的 数据 依赖 形式 。 本 节 首 先 从 属性 之 间 的 函数 依赖 关 
系 开始 介绍 ,在 此 概念 的 基础 上 ,介绍 几 种 不 同 的 函数 依赖 类 型 ,进而 建立 在 这 些 函 数 依赖 
类 型 基础 之 上 的 范式 理论 。 


4.2.1 函数 依赖 的 概念 


1. 函数 依赖 的 定义 

数据 依赖 包含 函数 依赖 、 多 值 依赖 、 连 接 依赖 、 分 层 依 赖 和 相互 依赖 等 ,其 中 ,函数 依赖 
是 最 常见 .最 重要 的 一 种 数据 依赖 。 例 如 ,在 学 生 关系 中 ,学 号 与 姓名 之 间 有 依赖 关系 ,因为 
对 于 每 个 确定 的 学 号 值 ,姓名 有 且 只 有 一 个 值 与 其 相对 应 ,类 似 于 数学 中 的 单 值 函 数 , 因 此 


称 学 号 函数 决定 姓名 ,或 者 称 姓名 函数 依赖 于 学 号 ,用 符号 表示 为 : 
学 号 一 姓名 

类 似 的 还 有 ,学 号 一 性 别 ,学 号 一 班级 等 。 

在 学 习 表 中 ,属性 学 号 与 成 绩 之 间 是 否 存在 这 种 函数 依赖 关系 呢 ? 由 于 一 个 确定 的 学 
号 可 能 会 有 多 个 成 绩 与 其 相对 应 ,表示 具有 该 学 号 的 学 生 选 修了 多 门 课程 。 因 此 学 号 不 能 
唯一 地 确定 一 个 成 绩 值 , 即 学 号 不 能 函数 决定 成 绩 ,用 符号 可 表示 为 : 

学 号 广 成 绩 
但 是 ,( 学 号 ,课程 号 ) 能 唯一 地 确定 成 绩 ,因此 有 : 
(学 号 ,课程 号 ) 一 成 绩 

如 上 所 述 ,函数 依赖 可 以 表达 一 个 关系 模式 属性 间 的 语义 联系 ,而 且 这 种 联系 只 能 通过 
语义 分 析 才 能 确定 。 

对 于 函数 依赖 的 定义 ,有 一 些 不 同 的 表述 方法 ,以 下 给 出 最 典型 的 两 种 。 

定义 4.1 设 RCIU) 是 属性 集 U 上 的 关系 模式 。 若 对 于 RCU) 的 任意 一 个 可 能 的 关系 
r,X、Y 是 属性 集 U 的 任意 子 集 , 当 且 仅 当 对 r 中 任意 一 个 给 定 的 X 的 属性 值 ,r 中 都 只 存在 
唯一 的 Y 属性 值 与 之 对 应 。 也 就 是 说 ,如 果 X 相等 ,就 有 Y 也 相等 , 则 称 Y 函数 依赖 于 X 
或 X 函数 确定 Y, 记 作 X>Y。 

定义 4.2 R(U) 的 属性 子 集 X、Y 之 间 的 函数 依赖 用 X 一 Y 表示 , 它 在 构成 关系 R 的 
任意 关系 + 上 指定 了 一 个 约束 。 这 个 约束 是 : 如 果 对 于 r 中 的 任何 两 个 元 组 t1 和 t2, 如 果 
有 t1[Xj==t2[Xj, 则 必 有 tl1[Yj=t2[Y]。 

无 论 是 哪 一 种 定义 ,本 质 上 都 是 强调 了 X 对 的 决定 作用 。 若 X 相等 则 Y 一定 相等 ; 
若 X 不 等 ,Y 可 以 相等 也 可 以 不 等 。 

一 个 函数 依赖 XY 也 可 以 用 图 形 表示 为 : 
X| 一 [|Y 


称 之 为 函数 依赖 图 。 

注意 : 关系 模式 R 上 的 函数 依赖 对 于 关系 中 的 所 有 实体 都 必须 满足 ,即使 有 一 个 特例 
的 存在 ,也 被 认为 这 个 函数 依赖 不 成 立 。 因 此 ,函数 依赖 不 是 指 关 系 模式 人 的 某 个 或 某 些 
关系 满足 的 约束 条 件 , 而 是 指 及 的 一 切 关 系 均 要 满足 的 条 件 。 

2. 几 个 基本 概念 

由 函数 依赖 的 定义 ,可 以 引出 如 下 一 些 基本 概念 。 

(1) 决定 因素 : 若 X-~Y, 则 X 被 称 为 决定 因素 。 

(2) 互相 依赖 : 若 X-~Y,Y 一 X, 称 X 和 YY 互相 依赖 , 记 作 Ye 一 X。 

(3) 若 Y 不 依赖 于 X, 则 记 作 X 六 Y。 

下 面 以 第 4. 1 节 中 的 关系 模式 S_D_P 为 例 , 说 明 函 数 依赖 的 定义 的 具体 含义 。 首 先 ， 
根据 调查 分 析 ,得 到 关系 模式 S D_P 中 的 属性 集合 以 及 存在 的 一 些 事实 关系 : 


D0= {学 号 ,姓名 ,学 院 名 称 , 院 长 ,项 目 编号 ,项 目 名 称 , 承担 任务 ,导师 姓名 } 


(1) 学 院 中 包含 若干 研究 生 , 某 个 研究 生 只 能 属于 固定 的 一 个 学 院 。 
(2) 学 院 的 负责 人 只 有 一 个 。 
(3) 每 个 研究 生 可 以 承担 多 个 项 目 , 每 个 项 目 可 以 由 多 个 研究 生 共同 参与 ,研究 生 选 定 
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项 目 后 要 承担 相应 的 任务 。 

(4) 每 个 研究 生 只 能 选择 一 个 导师 ,一 个 导师 可 以 带 若干 名 研究 生 。 

根据 以 上 条 件 结合 函数 依赖 的 概念 ,可 以 得 到 如 下 一 些 函 数 依赖 关系 。 

(1) 学 号 一 姓名 ,学 号 一 导师 姓名 ,学 号 一 学 院 名 称 。 

(2) 学 院 名 称 一 院 长 。 

(3) 项 目 编号 一 项 目 名 称 。 

(4) { 学 号 ,项 目 编号 } 一 承担 任务 。 

这 些 函 数 依赖 的 含义 如 下 。 

(1) 如 果 学 号 确定 ,研究 生 的 姓名 就 确定 ,导师 的 姓名 就 确定 ,学 院 名 称 就 确定 , 即 学 号 
相同 , 则 研究 生 姓 名 一 定 相同 ,学 号 不 同 ,研究 生 姓 名 可 以 相同 也 可 以 不 同 , 此 时 , 称 学 号 函 
数 确 定 研究 生 姓 名 ,或 者 研究 生 姓 名 函数 依赖 于 研究 生 学 号 。 

(2) 学 院 名 称 唯一 确定 学 院 的 院 长 , 即 学 院 名 称 函 数 确定 院 长 或 者 院 长 函数 依赖 于 学 
院 名 称 。 

(3) 项 目 编号 可 以 唯一 确定 项 目 名 称 , 即 项 目 编号 函数 确定 项 目 名 称 或 者 项 目 名 称 函 
数 依赖 于 项 目 编号 。 

(4) 研究 生 学 号 和 项 目 编 号 的 组 合 唯一 决定 某 个 研究 生 在 某 个 项 目 上 承担 的 任务 。 可 
见 , 决 定 因素 X 可 以 是 单个 属性 ,也 可 以 是 一 个 属性 组 ,研究 生 承 担 的 任务 只 能 被 学 号 和 项 
目 编号 的 组 合 唯一 决定 ,所 以 承担 任务 函数 依赖 于 学 号 和 项 目 编号 这 个 属性 组 。 

3. 几 种 类 型 的 函数 依赖 

为 了 深入 研究 函数 依赖 ,也 为 了 规范 化 的 需要 ,下 面 引入 几 种 不 同类 型 的 函数 依赖 。 

定义 4.3 一 个 函数 依赖 X 一 Y 如 果 满 足 Y 先 X, 则 称 此 函数 依赖 为 非 平凡 函数 依赖 
(Nontrivial Dependency) ,否则 称 之 为 平凡 函数 依赖 (Trivial Dependency)。 

例如 ,学 号 一 姓名 ,项 目 编号 一 项 目 名 称 ,都 是 非 平 凡 的 函数 依赖 ; {学 号 ,姓名 } 一 姓名 
则 是 平凡 函数 依赖 。 由 于 平凡 函数 依赖 不 产生 新 的 语义 ,所 以 若 不 做 特殊 说 明 , 本 书 讨 论 的 
都 是 非 平 凡 的 函数 依赖 。 

定义 4.4 在 RU) 中 ,如 果 X->Y, 并 且 对 于 X 的 任何 一 个 真子 集 X' ,都 有 X' 亡 Y 成 


立 , 则 称 Y 对 XX 完全 函数 依赖 (Full Functional Dependency) , 记 作 YY 
定义 4.5 在 RCIU) 中 ,如 果 X-~Y, 并 且 存 在 X 的 一 个 真子 集 X ,有 X' 一 Y 成 立 , 则 称 


YY 对 XX 部 分 函数 依赖 (Partial Functional Dependency) , 记 作 XY. 


例如 , {学 号 ,项 目 编号 )-> 承 担任 务 , {学 号 ,项 目 编号 ) 卫 ~ 学 院 名 称 ,因为 学 号 -> 
学 院 名 称 。 

定义 4.6 在 R(UD) 中 ,如 果 X>Y,(Y 和 X),Y 太 X,Y 一 Z, 则 称 Z 对 XX 传递 函数 依赖 
(Transitive Functional Dependency) , 记 作 区 

例如 ,学 号 一 ~ 院 长 就 是 一 个 传递 函数 依赖 关系 ,因为 学 号 一 > 学 院 名 称 ,学 院 名 称 
一 > 院 长 。 

通常 对 于 一 个 关系 模式 ,总 是 试图 从 属性 集中 找到 这 样 的 一 些 决定 因素 X,X 可 以 唯一 
地 确定 ( 即 函 数 确定 ) 属 性 集中 的 其 他 属性 ,这样 的 决定 因素 X 就 是 * 码 *。 在 第 2 章 中 ,给 


出 过 码 的 非 形式 化 定义 一 一 能 够 唯一 确定 一 个 元 组 的 最 小 属性 集 *。 在 下 文中 将 根据 函数 
依赖 的 概念 给 出 码 的 形式 化 定义 。 码 是 规范 化 理论 的 核心 ,所 以 对 码 进行 定义 的 函数 依赖 
理论 是 规范 化 理论 的 基础 。 


4.2.2 码 的 函数 依赖 定义 


在 第 2 章 中 ,曾经 给 出 过 码 的 定义 , 即 “ 在 关系 模式 R 中 ,可 以 唯一 确定 一 个 元 组 的 最 
小 属性 的 集合 ”, 从 4. 2. 1 节 的 函数 依赖 概念 可 知 , 若 X 唯一 确定 Y, 则 X、Y 之 间 存 在 着 函 
数 确定 关系 。 因 此 ,在 本 章 中 就 从 函数 依赖 的 角度 ,给 出 码 的 形式 化 定义 。 


定义 4.7 设 K 为 R<U,F> 中 的 属性 或 属性 组 , 若 K- 一 -U, 则 区 为 R 的 候选 码 。 若 
候选 码 多 于 一 个 , 则 选 定 其 中 的 一 个 为 主 码 。 

下 面 介绍 一 些 和 码 有 关 的 基本 概念 。 

1. 主 属性 和 非 主 属性 

包含 在 任何 一 个 候选 码 中 的 属性 , 称 为 主 属性 (Prime Attribute) 。 不 包含 在 任何 候选 
码 中 的 属性 称 为 非 主 属性 (Nonprime Attribute) 。 注 意 , 主 属性 并 不 是 只 包含 那些 在 主 码 
中 的 属性 ,而 是 包含 在 所 有 候选 码 中 的 属性 。 如 在 关系 模式 R( 学 号 ,身份 证 号 ,研究 生 姓 


名 ,课程 编号 ,成 绩 ) 中 ,由 于 (学 号 十 课程 编号 )- 和 成绩, (身份 证 号 十 课程 编号 )- 二 成绩 ， 
所 以 R 的 候选 码 有 两 个 : K1 一 学 号 十 课程 编号 ,K2 一 身份 证 号 十 课程 编号 。 在 研究 生 的 管 
理 系统 当中 ,通常 选择 K1 一 学 号 十 课程 编号 为 主 码 ; 同时 ,包含 在 所 有 候选 码 中 的 属性 ， 
学 号 .身份 证 号 .课程 编号 就 是 主 属性 ,研究 生 姓名 ,成绩 则 是 非 主 属性 。 能 否 正确 得 出 一 个 
关系 模式 中 的 主 属性 和 非 主 属性 ,是 下 文中 判断 一 个 关系 模式 属于 第 几 范式 的 关键 。 

2. 全 码 

最 简单 的 情况 是 , 码 只 包含 单个 属性 。 最 复杂 的 情况 是 所 有 属性 集 组 合成 码 , 称 为 全 
码 。 如 关系 模式 R( 学 生 , 教 室 ,教师 ) ,由 于 这 三 者 之 间 是 多 对 多 的 关系 ,所 以 ,要 确定 元 组 
中 的 任何 一 个 属性 ,都 必须 使 用 这 三 个 属性 的 集合 , 即 (学 生 ,教室 ,教师 ) 为 全 码 。 

3. 外 码 

关系 模式 R 中 属性 或 属性 组 X 并 非 R 的 主 码 , 但 X 是 另 一 个 关系 模式 的 主 码 , 则 称 X 
是 尺 的 外 码 。 

例如 ,关系 模式 S_P( 学 号 ,项 目 编号 ,承担 任务 ) ,研究 生 学 号 不 是 它 的 主 码 ,但 是 研究 
生 学 号 是 另 一 个 关系 模式 S( 学 号 ,姓名 ,学 院 名 称 ,导师 姓名 ) 的 主 码 ,所 以 称 研究 生 学 号 是 
关系 模式 S_P 的 外 码 。 主 码 和 外 码 提供 了 一 个 表示 关系 间 联 系 的 手段 。 如 研究 生 信息 和 
研究 生 的 工作 项 目 之 间 的 联系 就 是 通过 关系 模式 S_P 中 的 研究 生 学 号 来 实现 的 。 

4. 超 码 

根据 关系 对 主 码 的 定义 ,一 个 主 码 是 完全 函数 决定 关系 的 属性 集合 。 但 是 一 个 包含 关 
键 字 的 属性 集合 也 能 用 函数 决定 (但 不 是 完全 函数 确定 ,而 是 部 分 函数 确定 ) 属 性 全 集 ,这 种 
包含 主 码 的 属性 集合 称 为 超 码 (Super Key) 。 例 如 : 


学 号 ->( 学 号 ,姓名 ,学 院 , 性 别 ,班级 ) 
课程 号 -~( 课 程 号 ,课程 名 称 ,学 分 ) 
(学 号 ,课程 号 )- 二 ~( 成 绩 ) 
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学 号 .课程 号 及 (学 号 ,课程 号 ) 分 别 是 关系 模式 学 生 、 课 程 . 学 习 表 的 主 码 。 但 是 ， 
(学 号 ,姓名 ) 一 >( 学 号 ,姓名 ,学 院 , 性 别 , 班 级 ) 


(学 号 ,学 院 ) 一 >( 学 号 ,姓名 ,学 院 , 性 别 , 班 级 ) 
所 以 (学 号 ,姓名 ) 和 (学 号 ,学 院 ) 都 不 是 码 , 而 是 超 码 。 


4.2.3 范式 


在 第 4.1 节 中 已 经 看 到 ,选用 不 同 的 关系 模式 的 集合 作为 数据 库 的 模式 ,其 性 能 的 优 劣 
是 大 不 相同 的 。 为 了 区 分 关系 模式 的 优 劣 ,同时 也 为 了 将 不 合适 的 关系 模式 进行 优化 ,关系 
数据 库 的 创始 人 E. F. Codd 在 1971 一 1972 年 系统 地 提出 了 范式 的 概念 。 最 初 是 1NF 问 
题 ,随后 又 进一步 提出 2NF、3NF,1974 年 E. F. Codd 和 Boyce 共同 提出 了 BCNF。1976 
年 ,Fagin 提出 了 4NF, 后 来 又 出 现 了 5NF 等 。4NF 和 5NF 主要 用 于 理论 研究 ,在 设计 关 
系 模式 时 ,一 般 只 会 涉及 3NF 或 BCNF。 

范式 实际 上 表示 关系 模式 满足 的 某 种 约束 级 别 。 当 关系 模式 满足 某 级 别 范式 要 求 的 约 
束 条 件 时 ,就 称 这 个 关系 模式 属于 这 个 级 别 的 范式 , 记 作 RExzNF。 随 着 约束 条 件 越 来 越 严 
格 ,范式 的 级 别 也 越 来 越 高 ,其 中 ,对 于 各 种 范式 之 间 的 联系 有 : 

5NFC4NFCBCNFC3NFC2NFCINF 

一 个 满足 低 一 级 别 范式 的 关系 模式 ,通过 模式 分 解 可 以 转换 为 若干 更 高 级 别 的 范式 的 
关系 模式 的 集合 ,这 种 过 程 就 叫 作 规范 化 。 

1. 第 一 范式 (1NF) 

定义 4.8 设 R 是 一 个 关系 模式 ,如 果 R 中 的 每 一 个 属性 A 的 属性 名 和 属性 值 都 是 不 
可 再 分 的 , 则 称 R 属于 第 一 范式 , 记 作 RE 1NF。 

在 第 2 章 当 中 介绍 过 “关系 的 性 质 ”, 其 中 就 要 求 关系 中 的 属性 必须 是 原子 属性 ,所 以 ， 
一 个 关系 模式 最 起 码 要 满足 1NF。 

把 一 个 非 规范 化 的 关系 模式 规范 化 为 INF, 有 两 种 方法 ,一 种 方法 是 将 复合 属性 分 解 
为 多 个 原子 属性 ,使 其 变 为 单 值 属性 ; 第 二 种 方法 是 把 关系 模式 进行 分 解 , 使 得 分 解 后 的 每 
个 关系 模式 都 满足 1NF 的 要 求 。 

【 例 4-2〗 关系 模式 课程 Coursel 如 表 4-2 所 示 ,学 时 数 包含 讲课 、 实 验 两 个 子 属性 , 即 
属性 是 复合 属性 ,属性 名 可 以 再 分 ,所 以 课程 4F1NF。 


表 4-2 Coursel 
学 时 数 
课程 号 课程 名 称 
讲 课 实 验 
C0001 数据 库 原理 48 8 
C0002 数据 结构 44 20 


(1) 存在 的 问题 : 关系 模式 Coursel 中 若 要 求 查 询 “C0001” 号 课程 的 “讲课 ”学 时 数 , 原 
关系 模式 课程 无 法 从 学 时 数 的 属性 中 直接 得 到 结果 ,所 以 ,不 满足 第 一 范式 的 模式 将 直接 影 
响 到 对 模式 的 操作 ,因此 ,规范 化 理论 要 求 关系 模式 最 起 码 要 满足 1NF。 


(2) 解决 的 办 法 : 用 原子 属性 代替 原来 的 复合 属性 。 修 改 后 的 关系 模式 Course2 可 以 
对 每 个 属性 直接 操作 ,如 表 4-3 所 示 。 


表 4-3 Course2 
课 程 号 课程 名 称 讲课 学 时 实验 学 时 
Co001 数据 库 原理 48 8 
C0002 数据 结构 44 20 


【 例 4-3】 表 4-4 的 关系 模式 STUDENT1, 表 示 学 生 基本 信息 。 其 中 ,由 于 “电话 号 码 ” 
属性 的 值 不 唯一 ,不 是 原子 属性 值 ,所 以 STUDENT1IEINF。 
表 4-4 STUDENTI1 


学 号 姓 名 性 别 出 生日 期 学 院 电话 号 码 
15987657788 
S0001 李 明 男 1997-5-6 计算 机 0516-83596753 
15987657538 
15876543232 
S0002 1997-10-23 守 
纺 光 率 0516-83597673 


(1) 存在 的 问题 : 电话 号 码 为 多 值 属性 , 当 在 关系 模式 STUDENT1 中 添加 属性 “电话 
类 型 "时 ,就 无 法 正确 地 插入 某 个 学 生 的 某 电 话 号 码 所 属 的 电话 类 型 , 即 ( 学 号 ,电话 号 码 ) 一 
电话 类 型 的 函数 依赖 关系 。 
(2) 解决 的 办 法 : 将 关系 分 解 为 两 个 关系 STUDENT2 和 S-TEL, 如 表 4-5(a) 和 表 4-5(b) 
所 示 。 
表 4-5 STUDENT2 和 S-TEL 


(a) STUDENT2 QT 
学 号 | 姓 名 | 人 性 别 | 出 生日 期 | 学 院 学 号 | 电话 号 码 
S0001 李 明 男 1997-5-6 计算 机 So001 | 15987657788 
S0002 张 莉 女 1997-10-23 信和 电 S0001 | 0516-83596753 
本 加 思 S0001 | 15987657538 


S0002 | 15876543232 
S0002 | 0516-83597673 


2. 第 二 范式 (2NF) 

定义 4.9 若 RE1INF, 且 每 一 个 非 主 属性 都 完全 函数 依赖 于 码 , 则 RE2NF。 

在 关系 模式 项 目 ( 编 号 ,项 目 名 称 ,负责 人 编号 ,职务 ,成 员 编号 ,任务 情况 ) 中 ,项 目 € 
1NF, 主 码 是 (编号 十 成 员 编 号 ) ,并 且 存 在 以 下 完全 函数 依赖 和 部 分 函数 依赖 关系 。 


(编号 ,成 员 编号 ) 一- 任务 情况 
负责 人 编号 -一 -职务 
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因为 : 编号 -二 -项目 名 称 ， 所 以 ; (编号 ,成 员 编 号 ) > 项 目 名称 
因为 : 编号 -> 负责 人 编号 ”所 以 : (编号 ,成 员 编号 )-2 -负责 人 编号 
因 


为 : 编号 -> 职务 ”所 以 : (编号 ,成 员 编号 )-2 > 职务 
) 存在 的 问题 。 

@ 插入 异常 : 由 于 项 目 关系 模式 的 主 码 是 (编号 ,成 员 编号 ) ,所 以 , 当 一 个 新 项 目 建立 
了 ,还 没有 成 员 参 与 项 目 时 ,根据 实体 完整 性 规则 ,项 目 信息 会 因 缺 少 成 员 编号 导致 新 项 目 
信息 无 法 插入 到 关系 项 目 中 。 

@ 删除 异常 : 假设 某 些 成 员 离职 后 ,要 删除 他 们 的 信息 ,在 删除 这 些 成 员 信息 的 同时 ， 
连同 某 些 项 目 信 息 也 删除 掉 了 。 

@ 修改 异常 : 由 于 数据 宛 余 的 存在 ,所 以 如 果 更 换 某 个 项 目的 负责 人 ,那么 这 个 项 目 
负责 人 对 应 的 所 有 职务 属性 也 都 要 进行 更 新 ,即使 有 一 个 遗漏 ,都 会 造成 数据 的 不 一 至 
现象。 

(2) 解决 的 办 法 

分 析 上 面 的 例子 可 知 ,各 种 操作 异常 主要 是 由 于 存在 非 主 属性 对 码 的 部 分 函数 依赖 千 
成 的 ,如 项 目 名 称 完全 函数 依赖 于 编号 ,项 目 名 称 对 于 主 码 ( 编 号 十 成 员 编 号 ) 则 是 部 分 函数 
依赖 的 关系 ,要 消除 这 种 部 分 函数 依赖 ,可 以 对 关系 模式 项 目 进行 分 解 ,得 到 以 下 两 个 子 
模式 。 

项 目 (编号 ,项 目 名 称 , 负 责 人 编号 , 职务 ) 

任务 (编号 ,成 员 编号 ,任务 情况 ) 


分 解 后 的 函数 依赖 图 如 图 4-6 所 示 。 


一 


项 目 名 称 


项 目 编号 
任务 情况 6 二 项 目 编号 
成 员 编号 


负责 人 编号 


图 4-6 2NF 函数 依赖 图 


显然 ,分 解 后 的 关系 模式 都 属于 2NF。 那 么 ,一 个 关系 模式 满足 2NF 就 是 好 的 关系 模 
式 了 吗 ? 在 上 面 分 解 得 到 的 满足 2NF 的 关系 模式 中 ,仍然 存在 着 一 些 问题 ,还 需要 进一步 
地 对 其 进行 优化 ,下 面 先 给 出 3NF 的 概念 。 

3. 第 三 范式 (3NF) 

定义 4.10 关系 模式 RCIU,F) 中 若 不 存在 这 样 的 码 X, 属 性 组 Y 及 非 主 属性 组 Z(Z 生 
Y) ,使 得 X-~Y,YAX,Y 一 2Z 成 立 , 则 称 R(U,F) € 3NF。 
由 定义 可 知 ,车 RE3NF, 则 每 个 非 主 属性 既 不 部 分 函数 依赖 于 码 , 也 不 传递 依赖 于 码 ， 
即 若 RE3NF, 则 必 有 RE2NF。 
在 关系 模式 项 目 ( 编 号 ,项 目 名 称 , 负 责 人 编号 ,职务 ) 中 ,存在 着 如 下 函数 依赖 关系 。 


因为 : 编号 > 负责 人 编号 ,负责 人 编号 -> 职务 


因此 : 编号 一 ~ 职务 
所 以 : 项 目 E2NF 
(1) 存在 的 问题 。 

@ 插入 异常 。 若 对 于 一 个 新 晋级 的 负责 人 ,尚未 负责 任何 项 目 , 则 这 个 负责 人 及 其 职 
务 的 信息 就 会 由 于 缺少 “编号 ?这 个 主 属性 ,而 无 法 插入 到 表 中 。 

@ 删除 异常 。 若 某 个 负责 人 只 负责 了 一 个 项 目 , 当 这 个 负责 人 离职 时 ,删除 他 的 信息 
时 ,连同 项 目的 信息 也 将 被 删除 。 

@ 修改 异常 。 若 某 个 负责 人 的 职务 发 生变 动 , 设 该 负责 人 负责 N 个 项 目 , 则 职务 信息 
也 被 重复 存储 了 NN 次 ,更 新 职务 时 不 得 不 将 这 N 个 元 组 的 职务 值 全 部 更 新 ,即使 有 一 个 没 
有 更 新 ,也 会 产生 数据 的 不 一 致 性 。 

(2) 解决 的 办 法 。 

关系 模式 项 目 产 生 以 上 操作 异常 是 因为 模式 中 存在 着 非 主 属性 对 码 的 传递 函数 依赖 ， 
所 以 ,必须 从 原 模式 中 去 掉 这 些 传递 函数 依赖 ,将 关系 模式 项 目 进一步 分 解 可 得 : 

项 目 (编号 ,项 目 名 称 ,负责 人 编号 ) 

负责 人 (负责 人 编号 , 职务) 

这 样 ,对 关系 模式 项 目 进 行规 范 化 的 结果 , 当 其 满足 3NF 的 要 求 时 , 原 关系 模式 被 分 解 
为 以 下 三 个 子 模式 。 

项 目 (编号 ,项 目 名 称 ,负责 人 编号 ) 


负责 人 (负责 人 编号 , 职务) 
任务 (编号 ,成 员 编 号 ,任务 情况 ) 


分 解 后 的 函数 依赖 图 如 图 4-7 所 示 。 


任务 情况 =， 
负责 人 编号 
职务 


4-7 3NF 函数 依赖 图 


分 解 后 的 关系 模式 , 减 小 了 存储 宛 余 , 并 且 消 除了 各 种 操作 异常 。 那 么 ,一 个 满足 3NF 
的 关系 还 会 有 问题 出 现 么 ? 答案 是 肯定 的 ,原因 是 没有 对 主 属性 与 关键 字 之 间 给 出 任何 限 
制 ,如果 出 现 主 属 性 部 分 或 传递 依赖 于 KEY, 则 也 会 使 关系 性 能 变 坏 。 下 面 继续 介绍 
BCNF 的 概念 。 
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4. BCNF 

BCNF(Boyce Codd Normal Form) 是 由 Boyce 与 Codd 共同 提出 的 , 它 比 3NF 的 约束 
条 件 又 进 了 一 步 ,通常 认为 BCNF 是 修正 的 第 三 范式 ,有 时 也 称 其 为 扩充 的 第 三 范式 。 

定义 4.11 关系 模式 R(U,F)E1NF, 若 每 一 个 决定 因素 都 含有 码 , 则 RE BCNF。 

从 BCNF 的 定义 可 以 看 到 ,1NF~3NF 都 是 对 非 主 属性 的 函数 依赖 关系 的 约束 , 即 消 
除非 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 依赖 ,而 BCNF 同时 强调 主 属性 和 非 主 属性 对 
码 的 函数 依赖 关系 。 可 以 从 以 下 三 个 方面 理解 BCNF 的 定义 。 

(1) 所 有 非 主 属性 对 码 都 是 完全 函数 依赖 的 。 

(2) 所 有 的 主 属性 对 每 一 个 不 包含 它 的 码 也 都 是 完全 函数 依赖 的 。 

(3) 没有 任何 属性 完全 函数 依赖 于 非 码 的 任何 一 组 属性 。 

关系 模式 项 目 (编号 ,项 目 名 称 , 负 责 人 编号 ,职务 ) 中 ,编号 是 主 码 ,并 且 是 唯一 的 候选 
码 , 所 以 主 属性 是 编号 , 非 主 属性 是 (项 目 名称 , 负 责 人 编号 ,职务 ) , 非 主 属性 对 码 都 是 完全 
函数 依赖 的 ,所 以 项 目 E BCNF。 

【 例 4-4】 关系 模式 SIT( 学 生 , 课 程 ,教师 ) ,根据 具体 的 语义 ,得 到 以 下 关系 : 学 生 选 
择 了 某 门 课程 后 ,对 应 的 讲课 教师 就 只 有 一 位 ; 每 个 教师 就 只 讲授 一 门 课 ; 每 门 课 可 由 不 
同 的 教师 讲授 。 

根据 语义 ,得 到 如 下 函数 依赖 。 

(学 生 , 课 程 )- 一 -教师 ,( 学 生 , 教 师 )- -课程 ,教师 -一 -课程 

从 以 上 函数 依赖 可 知 , 关 系 模式 SIT 的 码 有 两 个 (学 生 , 课 程 ) 和 (学 生 ,教师 ) ,所 以 , 主 
属性 是 学 生 .课程 ,教师 ,没有 非 主 属性 , 故 SJT 至 少 属于 3NF。 但 是 ,SJT 是 否 属于 BCNF 
呢 ? 首先 ,( 学 生 , 课 程 )- 一 -教师 , 主 属性 * 教 师 * 完 全 函数 依赖 于 不 包含 它 的 码 , (学 生 , 教 
师 )- 二 -课程 ,由 于 存在 函数 依赖 关系 教师 一- 课程 ,决定 因素 "教师 "不 包含 码 , 因 此 ,SJTE& 
BCNF。 

(1) 存在 的 问题 。 

不 满足 BCNF 的 关系 模式 同样 存在 着 更 新 异常 。 例 如 ,在 SJT( 学 生 ,课程 ,教师 ) 中 ,如 
果 存 在 元 组 (S4,J1,T1) , 当 删除 信息 "学 生 S4 学 习 课程 J1 "时 ,将 同时 失去 “T1 教师 主讲 J1 
课 ” 这 一 信息 。 产 生 更 新 异常 的 主要 原因 是 ,属性 教师 是 决定 因素 , 却 不 是 码 。 

(2) 解决 的 办 法 。 

将 SJT 分 解 为 两 个 关系 模式 : ST( 学 生 , 课 程 ) 和 TJ( 教 师 , 课 程 ), 则 SJE BCNF,TJE 
BCNF ,而且 如 此 分 解 的 结果 就 解决 了 上 述 更 新 异常 问题 。 

3NF 和 BCNF 是 在 函数 依赖 的 条 件 下 对 模式 分 解 所 能 达到 的 分 离 程度 的 测度 。 一 个 
模式 中 的 关系 模式 如 果 都 属于 BCNF ,那么 在 函数 依赖 的 范畴 内 , 它 已 实现 了 彻底 的 分 解 ， 
即 已 消除 了 操作 异常 。3NF 的 “不 彻底 性 ”表现 在 可 能 存在 主 属性 对 码 的 部 分 函数 依赖 和 
传递 依赖 。 

5. 多 值 依赖 和 4NF 

1) 多 值 依赖 

前 面 都 是 在 函数 依赖 的 范围 内 讨论 问题 。 那 么 .属于 BCNF 的 关系 模式 就 很 完美 了 
吗 ? 下 面 来 看 一 个 例子 。 


【 例 4-5】 设 有 关系 模式 CTBR(CC.T,B) ,其 中 ,C 表示 课程 ,T 表示 教师 ,B 表示 教材 ， 


具体 关系 如 表 4-6 所 示 。 


表 4-6 关系 模式 CTBR 


已 gE B 
站 敏 数据 库 概论 
让 刘辉 数据 库 原理 与 应 用 
数据 结构 下 数据 结构 与 算法 设计 
刘备 数据 结构 
赵 小 亮 
这 张 表 显然 不 满足 1NF, 将 其 进行 规范 化 后 得 到 表 4-7。 
表 4-7 满足 1NF C-T-B 实体 之 间 的 关系 
G 六 B 
数据 库 间 敏 数据 库 概 论 
数据 库 间 敏 数据 库 原理 与 应 用 
数据 库 刘辉 数据 库 概 论 
数据 库 刘辉 数据 库 原 理 与 应 用 
数据 结构 徐 浩 数据 结构 与 算法 设计 
数据 结构 徐 浩 数据 结构 
数据 结构 刘 军 数据 结构 与 算法 设计 
数据 结构 刘 军 数据 结构 
数据 结构 赵 小 亮 数据 结构 与 算法 设计 
数据 结构 赵 小 亮 数据 结构 


关系 模式 CTB 的 码 是 全 码 , 因 而 CTBE BCNF。 但 是 当 某 一 课程 (如 数据 库 ) 增 加 一 名 
教师 (刘磊 ), 则 必须 插入 两 个 元 组 : 


(数据 库 , 刘 磊 , 数据库 概论 ) 
(数据 库 , 刘 震 , 数 据 库 原 理 与 应 用 ) 


同样 ,如 果 某 一 门 课 ( 数 据 结构 ) 要 减少 一 本 参考 书 (数据 结构 ), 要 同时 删除 三 个 元 组 : 


(数据 结构 , 徐 浩 ,数据 结构 ) 
(数据 结构 , 刘 军 ,数据 结构 ) 
(数据 结构 , 赵 小 亮 ,数据 结构 ) 
可 见 , 这 个 关系 模式 存在 大 量 元 余 ,那么 ,这 个 关系 模式 有 什么 问题 呢 ? 下面 先 介绍 一 
种 新 的 数据 依赖 一 一 多 值 依赖 。 
定义 4.12 设 有 R(U),X、Y 是 U 的 子 集 ,Z 二 U 一 X 一 Y。 多 值 依 赖 X 一 一 Y 成 立 , 当 
且 仅 当 对 R 的 任 一 具体 关系 r, 给 定 一 对 (X、Z) 值 ,就 有 一 组 Y 值 与 之 对 应 , 且 这 种 对 应 关 


系 与 Z 值 无 关 。 


多 值 依赖 具有 下 面 一 些 性 质 。 
0D 着 X>>Y 必 有 XU 一 X 一 Y。 


韩信 油 


关系 规范 化 理论 
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(2) 若 X-=Y, 则 必 有 X-~ 一 Y, 即 X-~Y 是 X 一 ~Y 的 特例 。 

读者 要 注意 ,讨论 了 关系 模式 中 的 多 值 依赖 ,而 且 函 数 依赖 是 多 值 依赖 的 一 种 特例 ,但 
并 不 意味 着 就 不 需要 函数 依赖 了 。 人 恰恰 相反 ,一般 来 说 ,不 仅 要 找 出 关系 模式 中 的 所 有 多 值 
依赖 关系 ,还 要 找 出 关系 模式 中 的 所 有 函数 依赖 。 这 样 ,一 个 完整 的 关系 模式 R(U) 就 可 能 
既 包 含 一 个 函数 依赖 集 下 ,又 包含 一 个 多 值 依赖 集 MF , 即 RCIU,F,MF) 。 

2) 第 四 范式 (4NF) 

定义 4.13 关系 模式 RC(U)E 1NF ,车 对 R 的 每 个 非 平凡 多 值 依赖 XY(Y 壬 X),X 
都 包含 码 , 则 称 RCU) 满 足 第 四 范式 , 记 为 RE4NF。 

一 个 关系 模式 若 属 于 4NF, 则 必然 属于 BCNF ,R 中 所 有 非 平 凡 的 多 值 依赖 实际 就 是 函 
数 依赖 。 

(1) 4NF 的 关系 模式 的 例子 。 

以 CTB( 课 程 ,教师 ,参考 书 ) 为 例 , 课 程 一 一 教师 ,课程 一 一 参考 书 , 它 们 都 是 非 平 凡 的 
多 值 依赖 , 而 CTB 的 码 是 全 码 , 即 码 是 (课程 ,教师 ,参考 书 ), 课 程 不 是 码 , 所 以 CTB 
¢ 4NF, 

(2) 存在 的 问题 。 

一 个 关系 模式 如 果 达 到 BCNF 但 不 是 4NF, 它 仍然 具有 不 好 的 性 质 。 比 如 ,在 CTB 
中 ,车 某 课 程 有 mm 个 教师 可 以 讲授 ,有 nn 本 教材 可 以 使 用 , 则 关系 中 有 该 课程 的 元 组 数目 一 
定 有 mXn 个 。 每 个 教师 重复 存储 次 ,每 本 教材 重复 存储 m 次 ,这 样 的 存储 元 余 , 造 成 更 
新 异常 的 问题 ,因此 对 于 不 满足 4NF 的 关系 模式 ,还 可 以 继续 规范 化 。 

(3) 解决 的 办 法 。 

将 关系 模式 CTB 分 解 为 CT( 课 程 ,教师 ) 和 CB( 课 程 ,教材 ) ,在 CT 中 虽然 有 课程 一 ~ 
教师 ,但 这 是 平凡 的 多 值 依赖 ,CT 中 不 存在 非 平 凡 的 非 函 数 依赖 的 多 值 依 赖 ,所 以 它们 都 
属于 4NF。 

综 上 所 述 ,关系 规范 化 的 主要 目的 如 下 。 

(1) 消除 异常 现象 。 

(2) 方便 用 户 使 用 ,简化 检索 操作 。 关 系 中 的 每 一 数据 项 应 是 一 个 简单 的 数 或 符号 串 ， 
而 不 是 一 组 数 或 一 个 重复 组 。 

(3) 增强 数据 独立 性 , 即 当 引入 新 数据 项 时 ,减少 对 原 有 数据 结构 的 修改 。 

(4) 使 关系 模式 更 加 灵活 ,更 容易 使 用 非 过 程 化 的 高 级 查询 语言 。 

(5) 更 容易 进行 各 种 查询 统计 工作 。 


4.3 数据 依赖 的 公理 系统 


研究 函数 依赖 是 解决 数据 元 余 的 重要 课题 ,其 中 重要 的 问题 是 在 一 个 给 定 的 关系 模式 
中 , 找 出 其 上 的 所 有 函数 依赖 。 这 就 需要 一 种 正确 、 完 备 的 推理 规则 系统 ,这 就 是 
Armstrong 公理 系统 。 
对 于 一 个 关系 模式 来 说 ,在 理论 上 总 有 函数 依赖 存在 ,例如 平凡 函数 依赖 ; 在 实际 应 用 
中 ,人 们 通常 也 会 制订 一 些 语义 明显 的 函数 依赖 ,这 样 , 一 般 总 有 一 个 作为 问题 展开 的 初始 
的 函数 依赖 集 , 假 设 记 作 下 。 


4.3.1 函数 依赖 集 的 闭 包 


1. 函数 依赖 集 F 的 逻辑 蕴涵 

定义 4.14 对 于 满足 一 组 函数 依赖 下 的 关系 模式 R(U, F) ,其 任何 一 个 关系 r, 若 函数 
依赖 X~~Y 都 成 立 , 则 称 下 人 逻辑 蕴含 X-~Y。 

如 果 考虑 到 下 所 逻辑 蕴涵 (推导 ) 的 所 有 函数 依赖 ,就 有 函数 依赖 集 闭 包 的 概念 。 

2. 函数 依赖 集 闭 包 

定义 4.15 称 所 有 被 一 个 已 知 函数 依赖 集 F 逻辑 蕴涵 的 那些 函数 依赖 的 集合 为 下 的 
闭 包 (Closure) , 记 为 F+ 。 

由 上 述 定义 可 知 ,由 已 知 函 数 依赖 集 F 求 得 的 新 的 函数 依赖 可 以 归结 为 求 F 的 闭 包 
F+ 。 为 了 用 一 套 系统 的 方法 求 下 的 闭 包 ,还 必须 遵循 一 组 函数 依赖 的 推理 规则 。 


4.3.2 函数 依赖 的 推理 规则 


为 了 从 关系 模式 R 上 已 知 的 函数 依赖 下 得 到 其 闭 包 F* ,1974 年 ,Armstrong 提出 了 一 
套 推理 规则 ,根据 这 套 规则 可 以 由 给 定 的 函数 依赖 集 F 推导 出 所 有 的 函数 依赖 关系 。 

设 有 关系 模式 R(U) 及 它 上 面 的 一 个 函数 依赖 集 F,X、Y、Z、W 是 U 中 的 子 集 。 

1. 独立 推理 规则 

独立 推理 规则 是 指 , 下 面 给 出 的 Armstrong 公理 的 三 条 推理 规则 是 彼此 独立 的 。 

(1) Al: 自 反 律 (Reflexivity) 。 

如 果 YESX, 则 X-~Y。 

根据 这 条 规则 可 以 推导 出 一 些 平 凡 函 数 依赖 。 由 于 @SXSU, 所 以 ,X 一 中 和 TU 一 X 
都 是 平凡 函数 依赖 , 即 都 可 以 由 自 反 律 得 到 。 注 意 : 由 自 反 律 得 到 的 函数 依赖 均 是 平凡 的 
函数 依赖 , 自 反 律 的 使 用 并 不 依赖 于 下。 

(2) A2: 增 广 律 (Augmentation)。 

如 果 ZEW, 且 XY, 则 XW 一 YZ。 

注意 ,有 一 些 特殊 情形 。 例 如 , 当 Z= 甸 时 ,车 XY, 则 对 于 U 的 任何 子 集 W 有 XW 一 
Y。 在 W=Z 时 ,车 XY, 则 XW>YW。 在 W=2Z=X 时 ,如 果 X 一 Y, 则 X 一 XY。 

(3) A3: 传递 律 (Transitivity) 。 

如 果 X>Y 且 YZ, 则 XZ。 

这 个 公理 系统 给 出 了 从 下 到 F? 的 推理 规则 。 根 据 A3, 若 XY,Y 习 ZEF, 则 必 有 
X 一 ZEF1 ; 根据 A2, 若 X-~YEF, 且 ZEW, 则 必 有 XW-~YZEF+。 

2. 其 他 推理 规则 

由 上 面 的 三 条 推理 规则 ,又 得 到 三 条 推论 (可 作为 定理 使 用 ) ,但 它们 不 是 独立 的 。 

推论 1: 合并 规则 (The Union Rule) 。 

若 XY,X>Z, 有 X 一 YZ。 

证 明 : 由 XY, 知 X 一 XY( 增 广 律 ); 由 XZ, 知 XY 一 YZ( 增 广 律 ); 所 以 X 一 YZ( 传 
递 律 ) 。 

推论 2: 分 解 规则 (The Decomposition Rule) 。 

X-~Y,ZSEY, 有 X-~Z。 


关系 规范 化 理论 


击 全 泪 


数据 亩 原理 与 应 用 (MySQL 版 ) 


证 明 : 由 ZSY, 可 知 Y>Z( 自 反 律 ), 又 因为 XY, 所 以 有 XZ( 传 递 律 )。 

推论 3: 伪 传 递 规 则 (The Pseudo Transitivity Rule) 。 

XY,WY 一 Z, 有 XW 一 2Z。 

证 明 : 由 XY, 得 到 WX 一 WY( 增 广 律 ), 又 因为 WY 王 Z, 所 以 XW 一 Z( 传 递 律 )。 

定理 4.1 若 A;(i 二 1,2,…,n) 是 关系 模式 R 的 属性 , 则 X 一 {Al ,As ,…,A,)} 成 立 的 充 
分 必要 条 件 是 X 一 A; 均 成 立 。 

证 明 : 

充分 性 : 因为 X 一 Ai,Ai(i 二 1,2,…,n) 是 关系 模式 R 的 属性 ,所 以 X 一 {Ali,As,…， 
A,} (合并 规则 )。 

必要 性 : 若 X 一 {Ai,As,…,A,), 则 X 一 A;( 分 解 规则 )。 


4.3.3 属性 集 闭 包 与 下 淄 辑 益 涵 的 充 要 条 件 


从 理论 上 讲 , 对 于 给 定 的 函数 依赖 集 FF, 只 要 反复 使 用 Armstrong 公理 系统 给 出 的 推理 
规则 ,直到 不 能 再 产生 新 的 函数 依赖 为 止 ,就 可 以 算出 F 的 闭 包 。 但 在 实际 应 用 中 ,这 种 方 
法 不 但 效率 低 , 而 且 会 产生 大 量 无 意义 的 或 者 意义 不 大 的 函数 依赖 。 由 于 人 们 感 兴趣 的 只 
是 下 的 闭 包 的 某 个 子 集 , 所 以 实际 过 程 中 几乎 没有 必要 算出 F 的 闭 包 自身 。 为 了 解决 这 个 
问题 ,就 引入 了 属性 集 闭 包 的 概念 。 

1. 属性 集 闭 包 

定义 4.16 设 有 关系 模式 RC(U),F 是 U 上 的 一 个 函数 依赖 集 ,XSEU, 定 义 

Xt 二 {A|X 一 A 能 由 FF 根据 Armstrong 公理 导出 } 

并 称 X# 为 属性 集 X 关 于 函数 依赖 集 F 的 闭 包 。 

由 属性 集 闭 包 的 概念 可 以 看 出 ,X# 是 这 样 一 些 被 决定 因素 X 函数 确定 的 属性 A 的 集 
合 , 其 中 ,X 一 A 能 由 下 根据 Armstrong 公理 推导 出 来 , 即 X 一 A 存在 于 F+ 中, 换 句 话说 , 属 
性 X 在 F 上 的 属性 集 闭 包 就 是 属性 X 能 够 推导 出 来 的 所 有 属性 的 集合 。 

所 以 ,很 容易 得 到 下 面 的 定理 4. 2, 用 来 判断 X~~Y 是 否 存在 于 下 的 闭 包 中 。 

2. 了 逻辑 昔 涵 的 充 要 条 件 

定理 4.2 设 下 为 属性 集 U 上 的 一 组 函数 依赖 关系 ,X\YSU,X 一 ~Y 能 由 下 根据 
Armstrong 公理 导出 的 充分 必要 条 件 是 YSXE 。 

定理 证 明 略 。 于 是 ,判断 某 一 函数 依赖 X 一 Y 是 否 能 由 下 根据 Armstrong 公理 导出 的 
问题 ,就 转换 为 求 Xt ,并 判断 Y 是 否 包含 于 Xt 的 问题 。 该 问题 可 由 算法 4. 1 解决 。 

3. 求 属 性 集 闭 包 算 法 

算法 4.1 求 Xt。 

求 属 性 集 X(X SU) 关于 U 上 的 函数 依赖 集 F 的 闭 包 XE 。 

输入 : 属性 全 集 U,U 上 的 函数 依赖 集 F, 以 及 属性 集 XSU。 

输出 : X 关 于 下 的 闭 包 XE 。 

方法 : 根据 下 列 步骤 计算 一 系列 属性 集合 XY”? ,XY ，… 

C= 
(2) 令 XeGtD 一 Xo UB。 
其 中 ,B={(ACVV)CVW)CV 一 WEFAVSE X®? AAEW))} 


即 B 是 这 样 的 集合 : 在 E 中 寻找 满足 条 件 V S Xe 的 所 有 函数 依赖 V 一 W ,并 记 属 性 
W 的 并 集 为 B。 

(3) 判断 Xc+rD 一 Xe 吗 ? 

(4) 若 Xec+ 天 Xe , 则 用 i 十 1 取代 i, 返 回 (2)。 

(5) 若 Xe 一 X9 , 则 X 中 即 为 Xt ,算法 终止 。 

该 算法 中 的 U、X 和 下 都 是 有 限 集 ,它们 的 任何 子 集 也 是 有 限 集 ; 另外 ,算法 每 一 步 的 
tt X?C U,B SU, 从 而 X 不 可 能 无 限 扩 大 , 即 计 算 过 程 是 有 限 的 ,经 过 有 

次 循环 后 ， 定 有 XGO 一 XG+D 一 XG+2 一 。… 

【 例 4-6】 设 F={(AB 一 C,C 一 A,BC~D,ACD 一 B,D~EG,BE 一 C,CG 一 BD,CE~~ 
AG), 令 X=BD, 求 对 。 

解 : 

Cy = =BD, 

(2) 在 F 中 找 所 有 满足 条 件 VSXt? = 二 BD 的 函数 依赖 V 一 W ,结果 为 : DEG , 则 算法 
第 二 步 中 的 B=EG, 于 是 Xf? = 二 X8? UB=BDEG。 

(3) 判断 是 否 X#+? 一 XP ,显然 XP 夫 Xgo 。 

(4) 在 F 中 找 所 有 满足 条 件 VEXP =BDEG 的 函数 依赖 V 一 W ,结果 为 BE 一 C, 于 是 

一 C, 则 X 包 一 XP UB=BCDEG。 

(5) 判断 是 否 X8 7 一 X 只 ,显然 X 欠 夫 XP 。 

(6) 在 下 中 找 所 有 满足 条 件 VSEXP =BCDEG 的 函数 依赖 V-W ,结果 为 C-~A,BC-~ 
D,CG 一 BD,CE 一 AG, 则 B 王 ABDG ,于 是 XP 一 XP UB 王 ABCDEG。 

(7) 判断 是 否 Xf+? 二 Xf ,这 时 虽然 XP 关 Xg ,但 XP 已 经 包含 全 部 属性 ,所 以 不 必 
再 继续 计算 下 去 。 若 继续 计算 , 必 有 X 吕 一 XP 。 

最 后 ,X 人 一 (BD) 寺 一 ABCDEG。 

【 例 4-7〗 已 知 关系 模式 RC(U,F), 其 中 ,U={A,B,C,D,E}; F={AB 一 D,B-~~CD， 
DE-~B,C-~D,D 一 A)} , 令 X=AB, 求 X+。 

解 : 

(1) Xo 一 AB。 

(2) XO 一 XoUDUC=ABCD。 

(3) X2 一 X 一 ABCD 不 变 , 所 以 X+ 二 (AB)+ 一 ABCD。 

对 于 属性 闭 包 算 法 的 终止 条 件 ,下列 4 种 方法 是 等 价 的 。 

CD XH XV, 

(2) 当 发 现 X 包含 全 部 属性 时 。 

(3) 在 FF 中 的 函数 依赖 的 右边 属性 中 ,再 也 找 不 到 Xe2 中 未 出 现 过 的 属性 。 

(4) 在 F 中 未 用 过 的 函数 依赖 的 左边 属性 中 已 没有 X® 的 子 集 。 

【 例 4-8〗 R={A,B,C,G,H,I)},F={A 一 B,A 一 C,CG 一 H,CG 一 1,B 一 H},AG 是 否 
为 R 的 超 码 ? 是 否 为 R 的 候选 码 ? 

解 : 

(1) 求 AG+={ABCGHI}=U, 因 此 AG 是 超 码 。 

(2) 根据 候选 码 的 定义 .判断 AG 的 非 空 真子 集 的 闭 包 是 否 包含 U。 
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真子 集 A+ 王 ABH。 

真子 集 G =G 均 不 为 U, 因 此 AG 是 候选 码 。 

4. 码 值 理论 

4.2.3 节 讨 论 了 关系 的 范式 级 别 ,由 此 可 知 要 准确 地 判定 出 关系 的 范式 级 别 ,必须 先 找 
出 关系 所 有 可 能 的 候选 码 。 如 果 问 题 相 对 简单 ,可 以 通过 分 析 关 系 中 属性 间 的 语义 确定 候 
选 码 ,但 是 当 遇 到 抽象 关系 ,函数 依赖 集 又 比较 复杂 的 情况 时 , 则 不 能 快速 确定 关系 所 有 的 
候选 码 ,因此 需要 给 出 求 候选 码 的 方法 。 
由 例 4-8 可 知 , 利 用 属性 集 闭 包 还 可 以 判断 某 个 已 知 的 属性 集 是 否 为 关系 的 候选 码 。 
那么 如 何 求 得 一 个 关系 的 所 有 候选 码 呢 ? 容易 想到 也 可 利用 属性 集 闭 包 来 求解 ,下 面 介绍 
码 值 理论 及 求 候选 码 的 算法 。 
对 于 给 定 的 关系 RCA ,As，,…,A,) 和 函数 依赖 集 F, 可 将 其 属性 分 为 以 下 4 类 。 
(1) 工 类 : 仅 出 现在 F 的 函数 依赖 左边 的 属性 。 
(2) R 类 : 仅 出 现在 F 的 函数 依赖 右边 的 属性 。 
(3) N 类 : 在 下 的 函数 依赖 左右 两 边 均 未 出 现 的 属性 。 
(4) LR 类 . 在 FE 的 函数 依赖 左右 两 边 均 出 现 的 属性 。 

定理 4.3 对 于 给 定 的 关系 模式 R 及 其 函数 依赖 集 F, 若 XIXER) 是 类 属性 , 则 X 
必 是 R 的 候选 码 的 成 员 。 

定理 4.4 对 于 给 定 的 关系 模式 R 及 其 函数 依赖 集 F, 若 XCXER) 是 N 类 属性 , 则 X 
必 是 R 的 候选 码 的 成 员 。 

定理 4.5 对 于 给 定 的 关系 模式 R 及 其 函数 依赖 集 F, 若 X(XER) 是 R 类 属性 , 则 X 
不 在 任何 候选 码 中 。 

综合 以 上 定理 ,可 以 得 到 候选 码 求解 的 一 个 重要 推论 。 

定理 4.6 对 于 给 定 的 关系 模式 R(U,F), 若 X(XER) 是 R 的 LL 类 或 N 类 属性 组 成 的 
属性 集 , 且 X+ 包含 R 的 全 部 属性 , 则 X 是 R 的 唯一 候选 码 。 

证 明 : 设 P 是 R 的 一 个 候选 码 。 

由 定理 4. 3 和 定理 4.4 可 知 ,车 X 包含 R 的 类 或 N 类 属性 , 则 XSP; 又 因为 X+ 包 
含 R 的 全 部 属性 , 即 X 一 U(X 是 R 的 一 个 超 码 ) , 则 X 之 P; 所 以 ,X=P, 即 X 是 R 的 唯一 候 
选 码 。 

【 例 4-9】 设 有 关系 模式 RC(A,B,C,D,E,P),R 的 函数 依赖 集 为 : FA~D,E-~D,D~~> 
B,BC-~D,DC-~A}, 求 R 的 候选 码 。 

解 : 

第 一 步 : C,E 是 工 类 属性 ,P 是 N 类 属性 ,所 以 CEP 包含 在 所 有 候选 码 中 。 

第 二 步 , (CEP)+ 王 ABCDEP。 

因此 ,由 定理 4.6 可 知 ,CEP 是 R 的 唯一 候选 码 。 

定理 4.6 给 出 了 唯一 候选 码 的 判定 方法 ,但 是 要 求 L、N 类 属性 集 的 闭 包 包 含 U, 如 果 
LN 类 属性 集 的 闭 包 不 包含 全 部 属性 集 U, 这 时 R 可 能 会 包含 多 个 候选 码 ,又 该 如 何 进行 
求解 呢 ? 下 面 介绍 多 属性 依赖 集 候选 关键 字 求解 算法 。 

算法 4.2 多 属性 依赖 集 候选 关键 字 求解 算法 。 

输入 : R(U) 及 下 。 


输出 : R 上 所 有 的 候选 关键 字 。 

(1) 将 R 的 所 有 属性 分 为 L、R、N 和 LR 两 类 , 令 X 代 表 L 和 N 类 ,Y 代 表 LR 类 。 

(2) 求 X+。 若 X+ 包 含 R 的 全 部 属性 , 则 X 为 R 的 唯一 候选 关键 字 , 转 5; 否则 转 3。 

(3) 在 Y 中 取 一 属性 A, 求 (XA)*。 若 它 包含 R 的 全 部 属性 , 则 转 4; 否则 ,调换 一 属 
性 反复 进行 这 一 过 程 ,直到 试 完 所 有 Y 中 的 属性 。 

(4) 如 果 已 找 出 所 有 候选 关键 字 , 则 转 5; 否则 在 Y 中 依次 取 两 个 、 三 个 …… 求 它们 的 
属性 闭 包 , 直 到 其 闭 包 包含 R 的 全 部 属性 。 

(5) 停止 ,输出 结果 。 

【 例 4-10】 设 有 关系 模式 R= 二 (O,B,I,S,Q,D) ,其 上 的 函数 依赖 集 : 
F==(S-~~D,D-~~S,I~B,B-~I,B-~O,O-~B) , 求 出 R 的 所 有 候选 关键 字 。 

解 : Q 为 左右 两 边 均 不 出 现 的 属性 ,属于 X 类 属性 ,一 定 在 候选 码 中 。 

其 余 属性 均 在 左右 两 边 出 现 ,为 Y 类 属性 。 

+={Q} 
根据 算法 从 Y 类 属性 中 取出 一 个 属性 与 X 结合 得 到 : 
(QB)+ =(QO)+=(QD+ = QBIO 
(QD)+ = (QS)+ =QDS 

从 立 类 属性 中 取出 两 个 属性 与 X 结合 ,经 过 如 上 发 现 B.O、I 是 等 价 的 属性 ,D、S 是 等 
价 的 属性 。 
因此 取 QBS, QBD, QOD, QOS, QID, QIS 分 别 求 其 属性 集 闭 包 , 经 过 计算 , 均 为 候 
选 码 。 

从 本 章 的 介绍 可 以 看 出 , 码 对 于 关系 模式 的 分 析 和 分 解 都 具有 重要 的 作用 。 在 讨论 一 
个 关系 模式 的 范式 级 别 时 ,需要 首先 确定 这 个 关系 模式 中 所 有 的 候选 码 ,然后 才能 区 分 主 属 
性 和 非 主 属性 ,通过 分 析 属 性 和 码 之 间 的 依赖 关系 ,判断 关系 模式 的 范式 级 别 。 


4.3.4 Armstrong 公理 的 正确 性 和 完备 性 


1. 正确 性 证 明 

(1) 正确 性 的 概念 : Armstrong 公理 是 正确 的 。 

(2) 证 明 : 

要 证 明 Armstrong 公理 是 正确 的 ,只 要 证 明 规则 Al,A2,A3 是 正确 的 就 可 以 了 。 

1) 自 反 律 Al 是 正确 的 

因为 YCX, 可 令 Z==X 一 Y, 从 而 有 X= YZ, 其 中 ,Z 可 能 为 空 。 设 + 是 关系 模式 R 上 的 
任 一 关系 ,t.u 为 + 的 任意 两 个 元 组 ,从 函数 依赖 的 语义 有 : 

tLX]=tEY2]=t[YJ]tL2]aLX]=a[Y2]=#[Yjal2] 

所 以 t[Xj] 二 u[XJ 时 , 必 有 t[Y]= 二 uLY]。 又 由 于 r 是 R 的 任意 一 个 具体 关系 ,按照 函 
数 依赖 定义 有 X 一 Y, 公 理 Al 得 证 。 

2) 增 广 律 A2 是 正确 的 

用 反 证 法 。 设 X,Y,ZCU,ZCW,r 是 关系 模式 RC(U) 上 的 任 一 具体 关系 , 且 满 足 X 一 
Y。t,u 为 rt 的 任意 两 个 元 组 , 设 tLXWj]=uLXWj]j。 于 是 , 必 有 tLY2Z]=uLYZ]j。 假 设 
t[XWj 二 u[XW]j, 但 是 tLYZj 关 uLYZj, 根 据 这 一 假设 , 若 tL[X] 二 uLXj,; 则 必 有 tLYj 关 
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uLY] ,与 假设 的 rz 满足 X->~Y 了 矛盾 。 公 理 A2 得 证 。 

3) 传递 律 A3 是 正确 的 

也 使 用 反 证 法 。 设 r 同 时 满足 XY 和 Y-~Z, 但 不 满足 X-~Z, 则 对 于 任 一 具体 关系 
上 的 任意 两 个 元 组 t,u, 就 有 t[Xj 二 ufXj, 但 t[2Zj 隆 u[Z]。 那 么 ,是 否 tLYj] 二 uLY]? 如 果 
t[Yj 关 uLY]j, 则 与 假设 的 +r 满足 XY 蔬 盾 ; 但 如 果 t[Y]j 二 u[ 站 ,而 t[ZjJ 关 u[2Zj, 由 与 假 
设 的 满足 Y-~Z 了 矛盾 。 公 理 A3 得 证 。 

2. 完备 性 证 明 

(1) 完备 性 的 概念 : F* 中 的 每 一 个 函数 依赖 ,必定 可 以 由 下 出 发 根据 Armstrong 公理 
推导 出 来 。 即 : 若 X->YEF+ , 则 X>Y 必定 可 以 由 下 出 发 根据 Armstrong 公理 推导 出 来 。 

(2) 证 明 : 

根据 原 命题 与 其 逆 否 命题 的 等 价 性 ,可 以 证 明 完备 性 命题 的 逆 否 命题 , 即 : 若 函数 依赖 
XY 不 能 由 函数 依赖 集 下 出 发 利用 Armstrong 公理 导出 ,那么 XY 必定 不 为 下 所 逻辑 
蕴涵 。 

首先 注意 : 如 果 XY 为 F 所 逻辑 蕴涵 , 则 必定 在 R(U, F) 的 任何 一 个 具体 的 关系 上 
都 成 立 。 因 此 ,假设 能 够 构造 出 一 个 具体 的 关系 +, 并 使 得 F* 中 的 所 有 的 函数 依赖 在 r 上 都 
成 立 ,那么 ,如 果 X~~Y 为 F 所 人 逻辑 蕴涵 , 则 必定 在 关系 r+ 上 成 立 。 

当然 ,如 果 能 够 根据 *X 一 Y 不 能 由 下 出 发 利用 Armstrong 公理 导出 ”这 个 前 提 条 件 , 推 
断 出 XY 在 具体 关系 +r 上 不 成 立 ,那么 就 说 明 X 一 Y 必定 不 为 F 所 逻辑 蕴涵 ,从 而 完备 性 
命题 得 证 。 

第 一 步 : 构造 关系 r, 证 明 EF 中 的 全 部 依赖 在 r 上 都 成 立 。 

构造 出 的 具体 关系 + 如 表 4-8 所 示 。 其 中 ,属性 分 为 两 组 ,Xi 为 一 组 ,其 余 为 另 一 组 ; 
元 组 有 s 和 + 两 个 , 且 二 者 在 X+ 属性 集 上 的 取 值 相同 ,在 其 余 属 性 集 上 的 取 值 完全 不 同 。 


表 4-8 关系 r 示 意图 


元 组 X* 的 属性 UR 
s 11…1 11…1 
t 11…1 00…0 


然后 证 明 下 中 的 全 部 依赖 在 r 上 都 成 立 。 假设 V 一 W 是 F 中 的 任 一 函数 依赖 , 则 V 一 
W 必定 在 关系 +r 上 成 立 。 因 为 倘若 不 成 立 , 则 必 有 sLVj = tLVj 且 sLW] 关 tLWj, 则 说 明 
V 包含 于 X+ 中 ,而 W 必 不 包含 于 X+ ; 又 因为 VSEX+ ,所 以 XV ,结合 VW 的 假设 , 则 
有 X-~W, 即 WSXTr ,这 与 W 必 不 包含 于 X+ 相 矛 盾 , 因 此 V 一 W 必定 在 关系 rz 上 成 立 ,也 
就 是 说 r 必 是 RC(U, FE) 的 一 个 关系 。 

第 二 步 : 根据 “X-~Y 不 能 由 下 从 Armstrong 公理 导出 ”, 证 明 关 系 r 不 满足 X-~Y。 

由 定理 4. 2 知 了 Y 生 Xt+ ,而 XSX+ ,由 表 4-8 可 以 看 出 ,s[X] = tLX] 且 s[Y] 冯 t[Y]， 
即 X-~Y 在 关系 r 上 不 成 立 。 

综合 以 上 两 步 ,Armstrong 公理 系统 的 完备 性 得 证 。 

Armstrong 公理 系统 的 完备 性 说 明了 “导出 ”和 “蕴含 ”的 等 价 性 。 因 此 ,F! 也 可 以 说 成 
是 由 下 出 发 借助 Armstrong 公理 系统 导出 的 函数 依赖 的 集合 。 


4.3.5 函数 依赖 集 的 等 价 和 最 小 函数 依赖 集 


设 有 函数 依赖 集 F,F 中 可 能 有 些 函 数 依赖 是 “元 余 ” 的 ,有 些 函 数 依赖 中 的 属性 是 元 余 
的 , 若 去 掉 这 些 宛 余 的 函数 依赖 和 宛 余 的 属性 ,F 在 某 种 意义 上 和 某 个 较 小 的 函数 依赖 集 
“等 价 ”, 人 们 自然 会 选择 “ 较 小 ”的 那个 函数 依赖 集 。 这 个 问题 的 确切 描述 为 “给 定 一 个 函数 
依赖 集 下 ,怎样 求 得 一 个 和 F' 等 价 ’ 的 “最 小 的 函数 依赖 集 Fm”。 

1. 函数 依赖 集 的 覆盖 与 等 价 

定义 4.17 设 F 和 G 是 依赖 集 ,车 F* = G+ , 则 称 上 与 G 等 价 , 记 为 FE=G。 

定理 4.7 下 和 G 等 价 的 充分 必要 条 件 是 : FSG 且 GSF” 。 

该 定理 给 出 了 检查 两 个 函数 依赖 集 F 和 G 是 否 等 价 的 方法 。 

第 一 步 : 检查 下 中 的 每 个 函数 依赖 是 否 属于 G+ , 若 全 部 满足 , 则 FSG” 。 

例如 , 若 有 X-~YEE, 则 计算 Xt ,如 果 YCSXé , 则 X-~YEG” 。 

第 二 步 ; 检查 是 否 GSF+ 。 

第 三 步 : 如 果 GSEEF+ , 且 FSG+* , 则 E 与 G 等 价 。 

2. 最 小 函数 依赖 集 的 定义 

定义 4.18 ”如 果 函 数 依赖 集 F 满足 下 列 条 件 , 则 称 下 是 一 个 极 小 函数 依赖 集 或 最 小 


覆盖 。 
(1) F 中 每 一 个 函数 依赖 的 右边 都 是 单个 属性 。 
(2) 对 下 中 任 一 函数 依赖 X 一 A,F 一 {X 一 A} 都 不 与 下 等 价 。 
(3) 对 于 下 中 的 任 一 函数 依赖 X 一 A,{F 一 {(X 一 A}}U 1{Z 一 A} 都 不 与 F 等 价 ,其 中 ,Z 
为 X 的 任 一 子 集 。 

上 述 三 个 条 件 的 作用 分 别 如 下 。 

(1) 条 件 1 保证 每 个 函数 依赖 的 右边 都 不 会 有 重复 的 属性 。 

(2) 条 件 2 保证 下 中 没有 元 余 的 函数 依赖 。 即 车 一 {X 一 A} 与 等 价 , 则 说 明 下 一 
{X 一 A}) 可 以 推导 出 {(X 一 A) ,说 明 {X-~A} 是 元 余 的 函数 依赖 。 

(3) 条 件 3 保证 每 个 函数 依赖 的 左边 没有 元 余 的 属性 。 如 果 {F 一 {XA}}U {ZA} 
与 F 等 价 ,说 明 可 以 用 ZA 代替 X 一 A, 而 Z 为 X 的 子 集 ,所 以 说 明 X 中 包含 元 余 的 属性 ， 
因此 ,要 去 除 这 些 宛 余 的 属性 。 

定义 4.19 如果 函数 依赖 集 F 与 某 个 最 小 依赖 集 Fm 等 价 , 则 称 Fm 是 下 的 最 小 覆盖 
或 Fm 是 下 的 最 小 依赖 集 。 

3. 最 小 函数 依赖 集 的 求解 算法 

算法 4.3 求 F 的 最 小 覆盖 的 算法 。 

(1) 检查 下 中 的 每 个 函数 依赖 X 一 A, 若 A 二 Al,As，,…,A4: 则 根据 分 解 规 则 ,用 X 一 A; 
(Gi 二 1,2,…,k) 取 代 XA。 

(2) 检查 下 中 的 每 个 函数 依赖 X 一 A, 令 G=F 一 {X 一 A}, 车 有 AE Xt , 则 从 下 中 去 掉 

(3) 检查 下 中 各 函数 依赖 X 一 A, 设 X=B ,Bs,…,B, ,检查 B;(i 二 1,2,…,m), 当 AE 
(X 一 BD)# 时 , 即 以 X 一 B; 替换 X。 

【 例 4-11】 将 下 列 函 数 依赖 集 F 划分 为 最 小 函数 依赖 集 。 
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F={A—>B,B>A,B—>C,A—>C,C—>A} 

解 : 

(1) 分 解 为 单个 属性 Fl 二 FF。 

(2) 消去 下 中 元 余 的 函数 依赖 。 

考察 A 一 B, 将 A 一 B 从 F 中 删除 : 令 久 =A, 求 X+==?,X(0)= 二 A,X(1)= 二 AC=X+。 因 
为 也 不 属于 X+ ,所 以 A 一 B 不 元 余 。 

考察 B-~A: 令 X=B, 求 X+=?,X(CO) 王 B,XC1) 王 BC,X(C2) 王 ABC 一 X+ 。 因 为 A 属 
于 X+ ,所 以 BA 元 余 。 

考察 BC; 令 X=B, 求 X+ 王 ?,X(0) 王 B,X(C1) 王 B 一 X+ 。 因 为 C 不 属于 X+ ,所 以 
BC 不 元 余 。 

考察 A 一 C: 令 X 一 A, 求 X+ 一 ?,X(0) 一 A,X(1) 一 AB,X(2) 一 ABC 一 X+ 。 因 为 C 属 
于 X+ 。 所 以 A 一 C 元 余 。 

考察 CA: 令 X=C, 求 X+=? X(0) 一 X(1) 一 C 一 X+ ,因为 A 不 属于 X+ ,所 以 CA 
不 宛 余 。 
因此 F2= {A 一 B,B>C,C>A} 

(3) 判断 每 个 函数 依赖 左边 是 否 有 元 余 属 性 。 

每 个 函数 依赖 的 左边 均 为 单 属性 ,不 存在 元 余 属性 ,因此 F2=={A 一 B,B 一 C,C 一 A}) 为 
所 求 的 最 小 覆盖 。 

(4) 如 果 在 第 2 步 中 ,首先 考察 BC: 求 B+ 王 ABC。 因 为 C 属于 B+ ,所 以 B 一 C 元 
余 , 得 到 F3={A-~B,B-~A,A-~C,C 一 A} ,再 考虑 其 他 的 函数 依赖 发 现 均 不 宛 余 ,因此 F3 
也 是 下 的 最 小 覆盖 。 

由 本 例 可 知 ,函数 依赖 集 下 的 最 小 覆盖 可 能 会 有 多 个 , 究 其 原因 ,不 难 发 现 是 在 第 二 步 
考察 元 余 函 数 依 赖 顺序 的 不 同时 所 导致 的 。 


4.4 关系 模式 的 分 解 方法 


在 前 面 的 讨论 中 ,已 经 知道 关系 模式 中 存在 的 函数 依赖 关系 将 影响 到 关系 模式 的 性 质 ， 
若 将 一 些 本 可 以 作为 独立 关系 存在 的 属性 集合 不 加 区 分 地 放 在 一 个 关系 模式 中 ,就 会 使 一 
些 属性 不 得 不 依附 于 其 他 关系 的 属性 ,造成 数据 元 余 和 操作 异常 现象 。 解 决 这 个 问题 的 途 
径 就 是 将 关系 模式 进行 分 解 , 使 描述 单一 实体 的 属性 集合 构成 一 个 独立 的 关系 模式 。 本 节 
主要 讨论 关系 模式 分 解 的 概念 ,以 及 分 解 时 应 当 满 足 的 基本 要 求 和 相应 的 分 解 算法 。 


4.4.1 模式 分 解 的 概念 


1. 模式 分 解 的 概念 
定义 4.20 关系 模式 R(U,F) 的 一 个 分 解 p 是 若干 个 关系 模式 的 一 个 集合 ,其 中 ， 
(DU= U U;, 即 关系 模式 R 的 属性 集 U 是 分 解 后 所 有 小 关系 模式 的 属性 集 U; 的 并 。 


(2) 对 每 个 i,j(1&i, j 志 n) ,有 U 生 Uj。 
(3) Fi(i 二 1, 2,…, 7) 是 下 在 U; 上 的 投影 , 即 F; 一 {XY| X>YEF+ 人 XYCSU,)。 


2. 模式 分 解 举 例 
【 例 4-12】 已 知 关系 模式 S D(U,F), 其 中 ,U= {学 号 ,学 院 代 码 , 院 长 },F 二 {学 号 
学 院 代 码 ,学 院 编号 一 院 长 }。S_D 的 一 个 实例 见 表 4-9。 


表 4-9 SD 
学 号 学 院 代 码 院 长 
0001 CS 张 明 
0002 CS 张 明 
0003 CE 李 韦 
0004 CE 李 韦 


分 析 可 知 ,关系 模式 S_D 的 唯一 候选 码 是 (学 号 ) ,由 于 存在 非 主 属性 ( 院 长 ) 和 主 属性 


(学 号 ) 之 间 的 传递 函数 依赖 : 学 号 一 一 院 长 ,所 以 S_DE2NF。 对 S_D 进行 分 解 ,可 以 得 到 
以 下 三 种 分 解 结果 。 

0 二 {Ri( 学 号 ){$)，R: (学 院 代码 ){$)}，Rs( 院 长 ){$}} 

oz 一 {Ri (学 号 , 学 院 代码 ) {学 号 一 学 院 代 码 } ,Rs (学 号 , 院 长 ) {学 号 一 院 长 }} 

os 一 {Ri( 学 号 , 学 院 代码 ) {学 号 一 学 院 代码 }，Rs (学 院 代码 , 院 长 ) {学 院 代码 一 
院 长 }} 

1) 第 一 种 分 解 m 

分 解 后 的 关系 r; 是 原 关系 模式 在 U; 上 的 投影 , 即 mm 一 S_D(CU;),m 二 {0001,0002， 
0003,0004}) ,rz 二 {CS,CE},r; 二 { 张 明 , 李 韦 }。 对 于 分 解 后 的 关系 模式 尽管 满足 BCNF, 但 
是 , 若 要 回答 “0001 号 学 生 是 哪个 学 院 的 ,他 的 院 长 是 谁 ” 这 样 的 问题 时 , 却 发 现 从 该 分 解 后 
的 模式 中 得 不 到 正确 的 答案 了 ! 这 是 因为 ,由 于 分 解 后 的 三 个 关系 模式 之 间 没 有 公共 属性 ， 
所 以 只 能 做 笛 卡 儿 积 连接 , 笛 卡 儿 积 的 结果 共有 4X2X2==16 个 元 组 ,而 原 关 系 模式 共有 4 
个 元 组 ,元 组 增加 了 ,原来 关系 中 的 信息 也 就 相当 于 丢失 了 。 所 以 ,从 分 解 pn 中 可 以 看 到 ， 
若 分 解 后 的 子 模式 可 以 通过 自然 连接 而 非 笛 卡 儿 积 运算 得 到 原来 的 关系 模式 ,这 种 分 解 的 
结果 才 是 正确 的 ; 否则 ,就 不 是 一 种 合理 的 分 解 方式 。 

2) 第 二 种 分 解 ps 

对 于 第 二 种 分 解 方法 ,可 以 证 明 : R 和 Rs。 都 满足 BCNF, 同 时 由 于 R 和 Rs 有 公共 属 
性 学 号 ,因此 可 以 通过 自然 连接 运算 恢复 到 原 关 系 模式 S_D。 但 是 这 种 分 解 存在 操作 异常 
现象 ,例如 ,如 果 要 插入 一 个 新 的 学 院 信 息 , 因 为 还 没有 研究 生 ,缺少 学 号 ,所 以 这 条 信息 无 
法 存 和 人。 类 似 地 ,如 果 某 个 学 院 的 院 长 调 离 了 学 校 ,在 删除 该 院 长 信息 的 同时 ,也 会 删除 掉 
他 所 在 的 学 院 的 信息 。 会 产生 这 些 操作 异常 的 原因 是 : 原来 在 S_D 模式 中 存在 的 函数 依赖 


学 院 代码 一 > 院 长 ,在 R, 和 Rs 中 都 不 存在 了 , 即 在 分 解 后 的 子 模式 中 , 原 模式 中 的 某 些 丙 
数 依赖 丢失 了 ,显然 这 也 不 是 一 种 合理 的 分 解 方法 。 

3) 第 三 种 分 解 ps 

6 一 {Ri( 学 号 , 学 院 代码 ) {学 号 一 学 院 代码 }， Rs (学 院 代码 , 院 长 ){ 学 院 代 码 一 院 
长 }} 。 可 以 证 明 ,os 既 可 以 通过 自然 连接 运算 恢复 到 原来 的 关系 模式 S_D, 又 保持 了 原来 
的 函数 依赖 集 F= { 学 号 一 学 院 代码 ,学院 代码 一 院 长 }, 所 以 os 是 一 种 合理 的 分 解 方式 。 
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通过 例 4-9 可 以 看 出 ,对 于 关系 模式 RCIU,F) 的 一 个 分 解 bo, 必须 从 两 个 方面 衡量 其 正 
确 性 , 即 分 解 bo 和 原 关 系 模式 R 之 间 是 否 具 有 "等 价 性 ”。 

(1) 分 解 前 的 关系 模式 R 和 分 解 后 的 是否 表 示 同 样 的 数据 , 即 分 解 是 否 导 致 数据 的 
丢失 。 

(2) 分 解 前 的 关系 模式 R 和 分 解 后 的 p 是 否 保持 相同 的 函数 依赖 , 即 分 解 是 否 导致 函 
数 依赖 的 丢失 。 

为 了 解决 以 上 两 个 问题 ,分 别 引 入 了 模式 分 解 “等 价 性 ?的 两 个 判定 准则 :“ 无 损 连 接 
性 ”和 “函数 依赖 保持 性 ”。 


4.4.2 分 解 的 无 损 连接 性 判定 


1. 分 解 的 无 损 连 接 性 (无 损 分 解 ) 

定义 4.21 无 损 分 解 的 概念 。 

设 R 是 一 个 关系 模式 ,F 是 R 上 的 一 个 函数 依赖 集 ,R 分 解 为 关系 模式 的 集合 p= 
{R CU)，R: (Us),…，R,(U,))。 如 果 对 于 R 的 满足 F 的 每 一 个 关系 r, 都 有 

r= We mI Hm mI on), 则 称 o 是 一 个 无 损 连 接 的 分 解 。 

2. 无 损 分 解 的 判定 算法 

算法 4.4 判断 分 解 的 无 损 连 接 性 。 

输入 : 一 个 关系 模式 RCA ,As ,…',A,),R 上 的 一 个 函数 依赖 集 F 以 及 R 的 一 个 分 解 
po 一 {{Ri ,Fi ) ,{(Ra ,F:)，…,{Re,Fe))。 

输出 : 确定 p 是 否 是 一 个 连接 不 失真 分 解 。 

方法 : 

(1) 构造 一 个 nn 列 k 行 表 , 第 i 行 对 应 于 R;, 第 j 列 对 应 于 属性 Aj ,如 表 4-10 所 示 。 


表 4-10 用 于 检验 连接 不 失真 的 nXk 表 


A A: ed A 


Rx 


(2) 填 表 : 若 A;€ Ri, 则 第 i 行 第 j 列 上 填 入 a ,否则 填 人 by 。 

(3) 修改 表 : 逐一 检查 下 中 的 每 一 个 函数 依赖 X-~Y ,如果 在 对 应 于 X 的 那些 属性 的 所 
有 列 上 X 的 符号 相同 ,就 使 这 些 符号 相同 的 行 中 对 应 于 Y 的 那些 属性 的 所 有 列 上 的 符号 也 
相同 。 即 如 果 其 中 有 a , 则 将 bs 改 为 a ; 车 无 a , 则 将 它们 全 改 为 by 。 一 般 来 说 ,i 是 其 中 
最 小 的 行 号 。 

(4) 反复 进行 (3) ,如 发 现 某 一 行 变 成 a ,az ,…',at, 则 此 分 解 p 具有 连接 不 失真 性 。 

注意 : 在 算法 第 3 步 中 ,修改 时 至 少 要 找到 两 行 上 的 X 值 相等 。 此 外 ,在 算法 第 4 步 
中 ,所 谓 “反复 ”, 即 包括 在 前 一 次 修改 后 继续 进行 修改 ,直到 表 中 的 数据 不 再 发 生变 化 。 


【 例 4-13】 设 有 关系 模式 R(B,0,I,S,Q,D), 其 上 的 函数 依赖 集 F={S-~D,I-~B， 
IS-~Q,B-~O)},R 的 一 个 分 解 为 p= 二 {SD,IB,ISQ,BO)}) ,这 样 的 分 解 具 有 无 损 连 接 性 吗 ? 
(1) 首先 构造 初始 表 , 填 表 . 如 表 4-11 所 示 。 


表 4-11 初始 表 
和 B 0 I 上 Q D 
R， 

SD bu ba bs a bs ai 
IB a bz as bz bs: bos 
ISQ bs bs as a as bs 
BO a az bss bu bi bus 
(2) 修改 表 。 
下 面 逐一 考察 下 中 的 函数 依赖 。 
@ SD, 可 以 将 bs 改 为 as, 如 表 4-12 所 示 。 


表 4-12 修改 表 1 
人 B O I S Q D 
R， 
SD bu ba bi a bs al 
IB al bz aa bz b: bx 
ISQ bs bs as 4 as as 
BO a az bss bu bs bu 


@ I>B,ba 改 为 al。 
@ IS-~Q, 因 为 IS 上 没有 值 相等 的 行 ,所 以 不 用 修改 表 。 
@ B-~O, 可 以 将 bs bs 都 改 为 a ,如 表 4-13 所 示 。 


表 4-13 修改 表 2 
B O I 性 Q Dy 
R; 

SD bn bz bs at bs ai 
IB an az as bz bzs bz 
ISQ an az as au as ai 
BO a az bss bu bss bss 

因为 表 4-13 中 出 现 了 ai ,az ,as，as，as ,as 的 行 , 所 以 该 分 解 具有 无 损 连 接 性 。 


【 例 4-14】 设 关系 模式 RCA, B, C, D, E),R 上 的 函数 依赖 集 F={A 一 C, C 一 DD， 
B-~C，CE-~A} ,判断 o 一 {AD,AB,BC,CDE,AE}) 这 样 的 分 解 具 有 无 损 连 接 性 吗 ? 
(1) 首先 构造 初始 表 , 结 构 如 表 4-14 所 示 。 


二 会 溃 
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表 4-14 初始 表 
Ai 
A B Le D E 
R; 

AD a bi bs a bs 
AB a az bss bs bss 
BC bs az as bs bss 
CDE bu bs as a as 
AE a bs bss bs as 


(2) 修改 表 。 逐 一 考察 中 的 函数 依赖 。 
@ A 一 C, 将 bs 和 bss 修 改 为 bs ,如 表 4-15 所 示 。 


修改 表 1 


表 4-15 


@ CD, 将 DD 列 全 部 修改 为 al ,如 表 4- 


表 4-16 


6 所 示 。 
修改 表 2 


AD a ba bi a bs 
AB a az ba al bss 
BC bs aa as a bss 
CDE bu bs as ay as 
AE a bs bs a as 

@ BC, 将 C 列 第 二 行 的 bs 修改 为 as ,如 表 4-17 所 示 。 

表 4-17 修改 表 3 
A 
A B C D E 
Ri 

AD a ba bs a bs 
AB a az aa au bos 
BC ba az as a bs 
CDE bu bs as a as 
AE a bs bs a as 


@ CE 一 A,CE 列 不 存在 相同 符号 的 行 , 不 修改 表 。 

进入 第 二 轮 修改 。 

@ A 一 C,A 对 应 的 属性 在 第 1,2,5 行 数值 相同 ,对 应 的 C 列 在 第 2 行 有 一 个 as ,因此 
将 C 列 的 第 1 行 bs 和 最 后 一 行 bis 改 为 as ,如 表 4-18 所 示 。 


表 4-18 修改 表 4 
A 
A B C D E 
Ri 

AD a ba aa a bs 
AB an az aa al bes 
BC bs az aa al bss 
CDE bu be as a as 
AE a bs as a as 


@ CD, 表 的 结构 不 变 。 
@ BC, 表 的 结构 不 变 。 
@ CE 一 A.,CE 列 的 第 4,5 行 相同 ,将 A 的 第 4 行 bu 修改 为 a, 如 表 4-19 所 示 。 


表 4-19 修改 表 5 
Ai 
A B Cc D E 
Ri 

AD a bi as al bs 
AB a az as a bx 
BC ba az as al bs 
CDE a bs as a as 
AE a bs aa a as 


进入 第 三 轮 修改 。 此 时 ,对 下 中 的 每 个 函数 依赖 , 表 的 结构 都 不 再 变化 。 又 因为 表 中 
没有 出 现 a ,as ,as ,as ,as 的 行 ,所 以 该 分 解 不 具有 无 损 连 接 性 。 

上 述 是 检验 连接 不 失真 的 一 般 性 方法 。 对 于 分 解 为 两 个 模式 的 情况 ,可 根据 下 面 的 定 
理 4.8, 用 更 简单 的 方法 进行 检验 。 

定理 4.8 设 o={Ri ,Rs:} 是 关系 模式 R 的 一 个 分 解 ,F 是 R 的 一 个 函数 依赖 集 , 则 对 于 
F,o 具有 连接 不 失真 性 的 充分 必要 条 件 是 Ri 门 Rs 一 Ri 一 REF+ ,或 Ri 门 Re 一 R: 一 Ri EFT。 
注意 : 该 定理 中 的 两 个 函数 依赖 不 一 定 要 属于 下 ,只 要 属于 F* 就 可 以 了 。 

【 例 4-15〗 设 有 关系 模式 R(A,B,C) ,函数 依赖 集 F 二 {A 一 B,C 习 B) ,分 解 0 二 {AB， 
BC} ,检验 p 是 否 具有 无 损 连 接 性 。 


解 : 
因为 (Ri Rs) 一 (Ri 一 R,)=(ABNBC)—>(AB—BC) 
=B>AE¢F! 
(RINR2)—>(R:—Ri)=(ABNBOCO—>(BC— AB) 
=B>CEF! 
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所 以 分 解 6 不 具有 无 损 连 接 性 。 

定理 4.8 和 例 4-15 说 明 一 个 事实 : 如 果 两 个 关系 模式 间 的 公共 属性 集 至 少 包含 其 中 一 
个 关系 模式 的 码 , 则 此 分 解 必定 具有 无 损 连 接 性 。 
4.4.3 分 解 的 函数 依赖 保持 性 判定 

1. 分 解 的 函数 依赖 保持 性 

定义 4.22 设 有 关系 模式 R(U, F),F 是 R 的 函数 依赖 集 ,Z 是 R 的 一 个 属性 集合 , 则 
把 F 中 所 有 满足 XYSZ 的 函数 依赖 X-~Y 组 成 的 集合 , 称 为 函数 依赖 集 下 在 属性 集 Z 上 
的 投影 , 记 为 [[ ,(F)。 

由 定义 4.22 可 知 , J[,(F) = {(X 一 Y1X 一 YE Ft, 且 XYCS2Z)。 对 于 RCU, F) 的 
一 个 分 解 6 二 {Ri1(Ui ,Fi),…,Ri(Uk ,Fi)},F 在 U; 上 的 投影 F; 可 以 表示 为 I[v(F) 即 ， 

I[, (= {X=Y|IX=YE€F',BXYSU,) 


尖 十 
定义 4.23 若 | Us , 则 RCU,F) 的 分 解 pb 一 {R CU ,Fi) ,RCUk ,Fi))} 


保持 函数 依赖 。 
2. 保持 依赖 的 判定 算法 
由 定义 4.23 的 概念 可 知 ,检验 一 个 分 解 是 否 具有 函数 依赖 保持 性 ,其 实 就 是 检验 函数 


k 
依赖 集 G= LF, 是 否 和 原 函 数 依赖 集 等 价 , 由 定理 4. 3 可 知 ,判断 函数 依 束 集 等 价 的 过 
程 分 为 以 下 三 步 。 
第 一 步 ; 检验 任 一 个 函数 依赖 X 一 YEF 是 否 可 以 由 G 根据 Armstrong 公理 导出 , 即 
YSXt 是 否 成 立 。 
第 二 步 : 检验 任 一 个 函数 依赖 X 一 YE G 是 否 可 以 由 下 根据 Armstrong 公理 导出 , 即 
YSXr 是 否 成 立 。 


第 三 步 ; 车 YX¢ 和 YX# 同时 成 立 , 则 有 | Us 成 立 。 


【 例 4-16】 关系 模式 R(U,F), 其 中 ,U={A,B,C,D},F={A 一 B,B 习 C,CD,D 一 
A} ,分解 op 二 {Ri1(A,B),R;(B,C) ,Rs(C,D)}) 是 否 具有 函数 依赖 保持 性 ? 
解 : 
F= 1, (= (A~B,B—A) 


Fs = [ly (EF) = (BC, C=—B) 
F= 1, = (CC»>D,D™»O) 


G=FIUF,UF={A>B,B—>A,B—>C,C—>B,C—>D,D—C} 
F={A—>B,B—>C,C—>D,D— A} 

显然 ,G 必定 包含 于 F+ 。 又 ASDt ,所 以 F 必定 包含 于 G+ 。 

因此 ,有 G+ =F+ , 即 o 具 有 函数 依赖 保持 性 。 


4.4.4 关系 模式 的 分 解 算法 


按照 上 面 讨论 的 模式 分 解 理论 ,一 个 模式 分 解 必须 满足 : 四 连接 不 失真 性 ; @ 函 数 依 
赖 保持 性 ; @ 某 一 级 范式 。 但 事实 上 不 能 顺利 地 同时 满足 上 述 三 个 条 件 。 一 般 而 言 ; 

(1) 若 要 求 连接 不 失真 ,分 解 可 达到 BCNF。 

(2) 若 要 求 函 数 依赖 保持 , 则 分 解 可 达到 3NF ,但 不 一 定 能 达到 BCNF 。 

(3) 若 同时 要 求 连接 不 失真 和 依赖 保持 , 则 分 解 可 达到 3NF ,但 不 一 定 能 达到 BCNF 。 

由 以 上 分 析 可 知 , 若 分 解 达到 3NF, 既 可 以 满足 连接 不 失真 ,又 可 以 满足 函数 依赖 保 
持 ; 同时 ,从 实际 工程 设计 的 需求 出 发 ,也 基本 上 要 求 分 解 达到 3NF 即 可 。 所 以 ,下 面 着 重 
介绍 两 个 满足 3NF 的 模式 分 解 算法 。 

1. 满足 3NF 的 函数 依赖 保持 分 解 算法 

算法 4.5 结果 为 3NF 的 依赖 保持 分 解 算法 。 

输入 : 关系 模式 R 和 函数 依赖 集 下 。 

输出 : 结果 为 3NF 的 一 个 依赖 保持 分 解 。 

步骤 ， 

(1) 如 果 R 中 有 某 些 属性 与 下 的 最 小 覆盖 F' 中 的 每 个 依赖 的 左边 和 右边 都 无 关 , 原 则 
上 可 由 这 些 属性 构成 一 个 关系 模式 ,并 从 R 中 将 它们 消除 ; 否则 ， 

(2) 如 果 F' 中 有 一 个 依赖 涉及 R 的 所 有 属性 , 则 输出 R; 否则 ， 

(3) 输出 一 个 分 解 o, 它 由 模式 XA 组 成 ,其 中 ,X 一 AEF'。 但 当 X 一 Al,X 一 As,*…， 
X 一 A, 均 属于 F' 时 , 则 用 模式 XA As…A, 代替 XA;(i 二 1,2,…,n)。 

【 例 4-17】 关系 模式 RC(U,F),U=={A,B,C,D.E,F,G} ,给 定 的 函数 依赖 集 F= {BCD 一 
A,BC>E,A>F,F>G,C>D,A 一 G) , 求 R 的 一 个 满足 3NF 的 函数 依赖 保持 分 解 。 

解 : 

第 一 步 : 求 F 的 最 小 覆盖 。 

Fm= {BC— AE, A—F,F—G,C—D}) 

第 二 步 : 对 于 Fm, 根 据 算 法 逐一 判断 ,条 件 (1)(2) 均 不 满足 ,因此 根据 条 件 (3) ,输出 分 
解 oe 二 {BCAE, AF, FG, CD}。 

即 6 是 RR 的 一 个 满足 3NF 的 函数 依赖 保持 的 分 解 。 

2. 满足 3NF 的 函数 依赖 保持 和 无 损 连 接 的 分 解 算法 

算法 4.6 结果 为 3NF, 且 依赖 保持 和 无 损 连 接 的 分 解 。 

设 6 二 {Ri,R,,…,R) 是 由 算法 4.4 得 到 的 满足 3NF 且 函 数 依赖 保持 的 分 解 ,X 为 R 
的 一 个 候选 码 , 则 t= 二 {Ri ,Rs，…, Ri,X} 是 R 的 一 个 分 解 , 且 + 中 的 所 有 关系 模式 均 满足 
3NF, 同 时 ,+t 既 具有 连接 不 失真 性 ,又 具有 依赖 保持 性 。 

由 算法 4.5 可 知 , 设 t+ 为 该 算法 的 一 个 分 解 ,t 的 求解 步骤 如 下 。 

(1) 通过 算法 4. 5 求 得 满足 3NF 的 函数 依赖 保持 的 分 解 3。 

(2) 若 8 包含 原 关系 模式 R 的 一 个 候选 码 , 则 tc 二 6, 算 法 终止 。 

(3) 若 5 不 包含 原 关 系 模式 R 的 一 个 候选 码 , 则 tr 二 {Ri ,Rs,…,R,X), 算 法 终止 。 

【 例 43-18〗 对 于 例 4-17, 求 R 的 满足 3NF, 且 依赖 保持 和 无 损 连 接 的 分 解 。 
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解 : 
第 一 步 : 根据 算法 4. 5, 得 到 R 的 一 个 满足 3NF 的 函数 依赖 保持 的 分 解 。 
ce= {BCAE, AF, FG, CD} 
第 二 步 : 求 R 的 一 个 候选 码 。 根 据 候选 码 的 形式 化 定义 ,如 果 属 性 或 属性 集 的 闭 包 等 
于 属性 集 U, 则 该 属性 或 属性 集 为 候选 码 。 
因为 (A)*7 = 二 AFG,(B)* = 二 B,(C)*+ 二 CD,…, 直 到 (BC)+ 时 有 : 
(BC)+ 一 ABCDEFG 


所 以 BC 是 R 的 一 个 候选 码 。 

第 三 步 : 判断 o 中 是 否 包含 BC。 

因为 BCSEBCAE 

所 以 = {BCAE,AF,FG,CD)} 

即 3 是 RR 的 一 个 满足 3NF 的 函数 依赖 保持 和 无 损 连 接 的 分 解 。 


小 结 


本 章 讨论 如 何 设计 关系 模式 的 问题 。 关 系 模式 设计 的 好 与 坏 ,直接 影响 到 数据 元 余 度 
和 数据 操作 的 一 致 性 等 问题 。 在 数据 库 中 ,数据 元 余 是 指 同一 个 数据 存储 了 多 次 ,数据 元 余 
将 会 引起 各 种 操作 异常 。 通 过 把 关系 模式 分 解 成 若干 子 模式 可 以 消除 元 余 现象 。 
因此 ,模式 分 解 需要 达到 什么 样 的 标准 ,以 及 如 何 进行 模式 分 解 就 是 非常 重要 的 问题 。 
要 解决 好 该 问题 ,除了 一 些 非 形式 化 的 直观 判定 方法 外 ,必须 有 系统 化 的 理论 和 方法 作为 基 
础 ,这 就 是 规范 化 理论 。 

首先 ,规范 化 理论 在 引入 数据 依赖 概念 的 基础 上 ,给 出 了 模式 分 解 可 能 达到 的 范式 标 
准 。 函 数 依 赖 X 一 Y 是 属性 间 最 基本 的 一 种 数据 依赖 关系 ,是 规范 化 理论 的 基础 。 范 式 是 
衡量 模式 优 劣 的 标准 ,是 对 关系 模式 中 属性 间 函 数 依赖 等 级 的 约束 。 

其 次 ,规范 化 理论 引出 了 Armstrong 公理 系统 以 及 属性 集 闭 包 (X# ) 和 最 小 函数 依赖 
集 的 算法 ,用 于 判定 两 个 函数 依赖 集 (FD) 是 否 等 价 ,以 及 计算 最 小 函数 依赖 集 。 这 些 概念 
和 算法 黄 定 了 模式 分 解 算 法 的 基础 。 

再 次 ,规范 化 理论 给 出 了 具体 的 模式 分 解 准则 和 算法 。 

关系 模式 在 分 解 时 应 保持 “等 价 ”, 分 解 的 等 价 性 通过 “无 损 连接 性 ”和 “函数 依赖 保持 
性 ”两 个 标准 进行 衡量 。 前 者 保持 关系 在 投影 连接 以 后 仍 能 够 恢复 回来 ,而 后 者 保证 数据 在 
投影 或 连接 中 其 语义 不 会 发 生变 化 。 

分 解 达到 BCNF 范式 的 算法 能 保证 分 解 的 “无 损 连 接 性 ”, 但 不 一 定 “ 函 数 依赖 保持 ”， 
而 分 解 达到 3NF 的 算法 既 能 保持 “无 损 连接 ”又 能 保证 “函数 依赖 保持 ”。 


习 题 4 


4.1 表 4-20 给 出 的 关系 R 为 第 几 范 式 ? 是 否 存在 操作 异常 ? 若 存在 , 则 将 其 分 解 为 
高 一 级 范式 。 分 解 完 成 的 高 级 范式 中 是 否 可 以 避免 分 解 前 关系 中 存在 的 操作 异常 ? 


表 4-20 关系 了 


工 程 号 材 料 号 数 量 开工 日 期 完工 日 期 价 格 
殷 MI1 5 1802 1809 2500 
P2 M2 8 1802 1809 3000 
P2 M3 23 1802 1809 12 000 
P3 M2 6 1810 1912 2800 
P3 M4 54 1810 1912 55 000 


4.2 设 有 关系 模式 R(A,B,C,D,E,P,G,H),R 的 函数 依赖 集 F={AB>CE,A 一 C， 
GP—>B,EP—>A,CDE—>P,HB>P,D>HG,ABC—>PG)}, 求 D+ 。 

4.3 ”证 明 函 数 依赖 集 F= {A 一 BC,A 一 D.CD 一 E}) 和 函数 依赖 集 G= {A 一 BCE, A 一 
ABD,CD 一 E} 的 等 价 性 。 

4.4 ” 设 关 系 模式 RCABCD) ,F 是 R 上 成 立 的 函数 依赖 集 ,F= 二 {A 一 B,C 一 B), 则 相对 
于 下 , 试 写 出 关系 模式 R 的 候选 码 , 并 说 明理 由 。 

4.5 设 有 关系 模式 R(A,B,C,D,E),R 的 函数 依赖 集 F= {ABD,B 一 CD,DE 一 B， 
C>D,D—>A)}.。 

(1) 计算 (AB)* ,(AC)+ ,(DE)+ 。 

(2) 求 R 的 所 有 候选 码 。 

(3) 求 F 的 最 小 覆盖 。 

4.6 设 有 关系 模式 R(A,B,C,D),R 的 函数 依赖 集 F={A 一 C,C 一 A,B 一 AC,D~ 
AC,BD~~A}, 求 下 的 最 小 覆盖 。 

4.7 设 关系 模式 RCABC) ,F 是 R 上 成 立 的 FD 集 ,F={C~~A,B-~A} ,分 解 p= 二 {AB， 
BC) ,判断 p 是否 具有 函数 依赖 保持 性 。 

4.8 设 关系 模式 RCABC) ,F 是 R 上 成 立 的 FD 集 ,F={C-~A,B-~C),po= 一 {AB,AC)， 
判断 o 是 否 具 有 "无损 连 接 性 ”和 “函数 依赖 保持 性 ”。 

4.9 设 关系 模式 RCIABCD) ,在 R 上 有 5 个 相应 的 FD 集 及 分 解 : 

(1) F={B>C,D—>A},pe={AD,BC} 

(2) F={AB>C,C>A,C—>D} ,oe={ACD,BC} 

(3) F={A—BC,C—>AD} ,oe= {ABC, AD} 

(4) F={A—>B,B—>C,C—>D} ,oe={AB,ACD} 

(5) F={A™>B,B™>C.C—™>D},o={AB.,AD.CD} 

试 对 上 述 5 种 情况 分 别 回答 下 列 问题 。 

(1) 确定 R 的 候选 码 和 主 码 。 

(2) 是 否 为 无 损 分 解 ? 

(3) 是 否 函 数 依赖 保持 ? 

(4) 确定 o 中 每 一 模式 的 范式 级 别 。 

4.10 设 有 关系 模式 RCA,B,C,D),R 的 函数 依赖 集 F={AB 一 C,C 一 D,D 一 E)}。 判 
断 分 解 二 {Ri(ABC) ,R;(CD) ,Rs (DE)} 是 否 为 无 损 连 接 分 解 。 并 且 : 

(1) 求 R 的 所 有 候选 码 。 

(2) 求 下 的 最 小 覆盖 。 
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(3) 将 R 分 解 为 3NF 并 具有 无 损 连 接 性 和 函数 依赖 保持 性 。 

4.11 设 有 关系 模式 R(U)==(A,B,C,D,E,F,G),F={AB>C,C~EG,C>A, BE 
C,BC-~D,CG-~BD,ACD-~B,CE-~AG)}, 求 函数 依赖 集 F 的 最 小 覆盖 。 

4.12 设 有 关系 模式 R( 职 工 名 ,项目 名 ,工资 ,部门 名 ,部 门 经 理 )。 如 果 规 定 每 个 职工 
可 参加 多 个 项 目 , 各 领 一 份 工资 ; 每 个 项 目 只 属于 一 个 部 门 管理 ; 每 个 部 门 只 有 一 个 经 理 。 

(1) 试 写 出 关系 R 的 基本 FD 和 候选 码 ,确定 主 码 。 

(2) 说 明 R 不 是 2NF 的 理由 ,并 把 R 分 解 成 2NF 的 模式 集 。 

(3) 把 R 分解 成 3NF 模式 集 , 说 明理 由 。 

4.13 表 4-21 给 出 一 数据 集 ,请 判断 它 是 否 可 直接 作为 关系 数据 库 中 的 关系 。 若 不 
行 , 则 改造 成 为 尽 可 能 好 的 并 能 作为 关 数 据 库 中 关系 的 形式 ,同时 说 明 进 行 这 种 改造 的 
理由 。 


表 4-21 数据 集 
系 名 课 程 名 教 师 名 
计算 机 系 DB 张 伟 ,王强 
信 控 系 AI 孙 兰 , 宋 灵 
信息 安全 系 DS 张 燕 , 李 杰 
数学 系 CM 刘海 


4.14 建立 关于 系 学 生 班级 社团 等 信息 的 一 个 关系 数据 库 ,一 个 系 有 若干 个 专业 ,每 个 
专业 每 年 只 招 一 个 班 ,每 个 班 有 若干 学 生 ,一 个 系 的 学 生 住 在 同一 宿舍 区 ,每 个 学 生 可 以 参 
加 若干 个 社团 ,每 个 社团 有 若干 个 学 生 。 

。 描述 学 生 的 属性 有 : 学 号 ,姓名 ,出 生年 月 , 系 名 ,班级 号 ,宿舍 区 。 

。 描述 班级 的 属性 有 : 班级 号 ,专业 号 , 系 名 ,人 数 , 人 学 年 份 。 

。 描述 系 的 属性 有 : 系 名 , 系 号 ,办 公 室 地 点 ,人 数 。 

。 描述 社团 的 属性 有 : 社团 名 ,成 立 年 份 ,地 点 ,人 数 , 学 生 参 加 某 社团 的 年 份 。 

(1) 请 给 出 关系 模式 ,指出 是 否 存 在 传递 函数 依赖 ,对 于 函数 依赖 左边 是 多 属性 的 情况 
讨论 函数 依赖 是 完全 函数 依赖 ,还 是 部 分 函数 依赖 。 

(2) 指出 各 关系 的 候选 码 、 外 码 , 有 没有 全 码 存在 ? 


第 5 章 数据 库 设 计 


5.1 数据 库 设计 概述 


5.1.1 数据 库 设计 的 定义 和 知识 要 求 


数据 库 设计 是 指 对 于 一 个 给 定 的 应 用 环境 ,根据 用 户 的 需求 ,在 某 一 具体 的 数据 库 管理 
系统 上 ,构造 一 个 性 能 良好 的 数据 模式 ,建立 数据 库 及 其 应 用 系统 ,使 之 能 够 有 效 地 存储 数 
据 ,满足 各 种 用 户 的 信息 需求 和 处 理 需 求 。 

(1) 信息 需求 。 信 息 需 求 表 示 一 个 单位 所 需要 的 数据 及 其 结构 ,表达 了 对 数据 库 的 内 
容 及 结构 的 要 求 , 也 就 是 静态 要 求 。 信 息 需 求 定义 所 设计 的 数据 库 将 要 用 到 的 所 有 信息 , 描 
述 实体 、 属 性 ,联系 的 性 质 , 描 述 数 据 之 间 的 联系 。 

(2) 处 理 需 求 。 处 理 需 求 表 示 一 个 单位 需要 经 常 进 行 的 数据 处 理 , 表 达 了 基于 数据 库 
的 数据 处 理 要 求 , 也 就 是 动态 要 求 。 处 理 需求 定义 所 设计 的 数据 库 将 要 进行 的 数据 处 理 , 描 
述 操作 的 优先 次 序 ,操作 执行 的 频率 和 场合 ,描述 操作 与 数据 之 间 的 联系 。 
因此 ,数据 库 设计 就 是 把 现实 世界 中 的 数据 ,根据 各 种 应 用 处 理 的 要 求 ,加 以 合理 地 组 
组 ,使 其 满足 硬件 和 操作 系统 的 特性 ; 同时 ,利用 已 有 的 DBMS 建立 数据 库 , 使 其 能 够 实现 
应 用 系统 的 目标 。 
数据 库 设计 是 一 个 庞大 而 且 复 杂 的 工程 ,数据 库 设 计 人 员 应 该 具备 以 下 知识 。 

(1) 计算 机 科学 的 基础 知识 和 程序 设计 的 方法 与 技巧 。 

作为 一 个 数据 库 的 设计 人 员 ,首先 必须 是 一 个 懂得 计算 机 专业 的 人 员 ,而 作为 计算 机 专 
业 的 人 员 ,最 基本 的 就 是 计算 机 科学 的 基础 知识 ,其 次 应 该 掌握 关于 程序 设计 的 知识 和 程序 
设计 的 方法 与 技巧 。 

(2) 数据 库 的 基本 知识 和 数据 库 设 计 技 术 。 

除了 具有 计算 机 的 基础 知识 以 外 ,作为 数据 库 的 设计 人 员 必 须 具 有 数据 库 的 基本 知识 
和 数据 库 设 计 技巧 。 

(3) 软件 工程 的 原理 和 方法 。 

在 数据 库 领 域内 ,常常 把 使 用 数据 库 的 各 类 系统 称 为 数据 库 应 用 系统 。 数 据 库 应 用 系 
统 的 开发 应 该 遵循 软件 工程 的 方法 和 原理 。 尤 其 是 大 型 数据 库 设计 ,其 开发 周期 长 .耗资 
大 ,失败 的 风险 也 大 ,必须 把 软件 工程 的 原理 和 方法 应 用 到 数据 库 建设 中 来 。 

(4) 应 用 领域 的 知识 。 

应 用 领域 的 知识 随 着 应 用 系统 所 属 的 领域 不 同 而 不 同 ,如 财务 管理 ,仓库 管理 、 人 事 管 
理 、 教 务 管理 等 。 而 且 同 样 是 教务 管理 ,大 学 .中 学 、 小 学 等 不 同类 型 的 学 校 , 各 不 相同 ,即使 
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都 是 高 等 学 府 各 个 学 校 的 管理 方式 也 不 相同 。 因 此 ,数据 库 设 计 人 员 必 须 深入 实际 与 用 户 
密切 结合 ,对 应 用 环境 ,专业 业务 流程 进行 详细 的 调查 研究 ,才能 设计 出 符合 具体 应 用 领域 
和 用 户 要 求 的 数据 库 应 用 系统 。 


5.1.2 数据 库 设计 的 内 容 


数据 库 设 计 包 括 结构 设计 和 行为 设计 两 方面 的 内 容 。 

1. 数据 库 的 结构 设计 

数据 库 的 结构 设计 是 指 根据 给 定 的 应 用 环境 ,进行 数据 库 的 模式 或 子 模式 的 设计 。 它 
包括 数据 库 的 概念 设计 、 人 逻辑 设计 和 物理 设计 。 数 据 库 模式 是 各 应 用 程序 共享 的 结构 ,是 静 
态 的 ,稳定 的 ,一 经 形成 后 通常 情况 下 是 不 容易 改变 的 ,所 以 结构 设计 又 称 为 静态 模型 设计 。 

2. 数据 库 的 行为 设计 

数据 库 的 行为 设计 是 指 确 定数 据 库 用 户 的 行为 和 动作 。 而 在 数据 库 系统 中 ,用 户 的 行 
为 和 动作 指 用 户 对 数据 库 的 操作 ,这 些 要 通过 应 用 程序 来 实现 ,所 以 数据 库 的 行为 设计 就 是 
应 用 程序 的 设计 。 用 户 的 行为 总 是 使 数据 库 的 内 容 发 生变 化 ,所 以 行为 设计 是 动态 的 ,行为 
设计 又 称 为 动态 模型 设计 。 

数据 库 的 结构 设计 和 行为 设计 是 不 能 分 离 的 ,分 离 会 导致 数据 与 程序 不 易 结合 ,增加 数 
据 库 设计 的 复杂 性 。 本 章 重 点 介绍 数据 库 的 结构 设计 ,对 于 数据 库 的 行为 设计 请 参考 “软件 
工程 ?相关 书籍 。 

由 于 数据 库 的 设计 和 开发 是 一 个 庞大 而 且 复杂 的 工程 ,涉及 多 学 科 的 综合 性 技术 ,所 
以 ,数据 库 设计 是 涉及 硬件 .软件 和 管理 的 综合 技术 ,这 也 是 数据 库 设计 的 另外 一 个 特点 。 
有 人 讲 “ 三 分 技术 ,七 分 管理 ,十 二 分 基础 数据 ?是 数据 库 建 设 的 基本 规律 ,这 是 有 一 定 道 
理 的 。 


5.1.3 数据 库 设计 方法 


数据 库 设计 方法 目前 可 分 为 4 类 : 直观 设计 法 规范 设 计 法 .计算机 辅助 设计 法 和 自动 
化 设计 法 。 

1. 直观 设计 法 

直观 设计 法 也 叫 手 工 试 次 法 , 它 是 最 早 使 用 的 数据 库 设 计 方 法 。 这 种 方法 依赖 于 设计 
者 的 经 验 和 技巧 ,缺乏 科学 理论 和 工程 原则 的 支持 ,设计 的 质量 很 难保 证 ,常常 是 数据 库 运 
行 一 段 时 间 后 又 发 现 了 各 种 问题 ,这 样 就 不 得 不 修改 原 有 设计 ,增加 了 系统 维护 的 代价 。 因 
此 这 种 方法 越 来 越 不 适应 信息 管理 发 展 的 需要 。 

对 于 一 个 简单 的 程序 设计 过 程 来 说 ,这 样 的 方法 具有 周期 短 ,效率 高 ,操作 简便 、 易 于 实 
现 等 优点 。 但 是 对 于 数据 库 设计 ,尤其 是 大 型 数据 库 系 统 的 设计 ,由 于 其 信息 结构 复杂 、 应 
用 环境 多 样 .应 用 需求 全 面 等 系统 化 综合 性 的 要 求 ,通常 需要 若干 个 人 的 共同 努力 ` 相 互 协 
调 ,综合 多 种 知识 才能 完成 ,所 以 ,在 具有 丰富 经 验 和 设计 技巧 的 前 提 下 ,还 应 该 以 严格 的 科 
学 理论 和 软件 工程 设计 原则 为 依托 ,完成 数据 库 设计 的 全 过 程 。 

2. 规范 设计 法 

规范 设计 法 是 将 数据 库 设计 分 为 若干 阶段 ,明确 规定 各 阶段 的 任务 ,采用 自 项 向 下 、 分 
层 实现 .逐步 求 精 的 设计 原则 ,结合 数据 库 理论 和 软件 工程 设计 方法 ,实现 设计 过 程 的 每 一 


细节 ,最 终 完成 整个 设计 任务 。 

1978 年 10 月 ,来 自 三 十 多 个 国家 的 数据 库 专 家 在 美国 新 奥尔良 市 专门 讨论 了 数据 库 
设计 问题 ,他 们 运用 软件 工程 的 思想 和 方法 ,提出 了 数据 库 设 计 的 规范 ,这 就 是 著名 的 新 奥 
尔 良法 , 它 是 目前 公认 的 比较 完整 和 权威 的 一 种 规范 设计 法 。 新 奥尔良 法 将 数据 库 设计 分 
成 需求 分 析 ( 分 析 用 户 需 求 ) ,概念 设计 (信息 分 析 和 定义 ) 、 逻 辑 设计 (设计 实现 ) 和 物理 设计 
(物理 数据 库 设 计 )。 此 后 ,S. B. Yao 等 人 提出 了 数据 库 设计 的 6 个 步骤 : 需求 分 析 、 模 式 
构成 ,模式 汇总 、 模 式 重 构 ,模式 分 析 和 物理 数据 库 设计 ,从 而 逐渐 形成 了 数据 库 规范 化 设计 
方法 。 

目前 ,常用 的 各 种 数据 库 设计 方法 都 属于 规范 设计 法 , 即 都 是 运用 软件 工程 的 思想 和 方 
法 ,根据 数据 库 设计 的 特点 ,提出 了 各 种 设计 原则 与 设计 规程 。 常 用 的 规范 化 设计 方法 主要 
有 : 基于 E-R 模型 的 数据 库 设 计 方法 ,基于 3NF 的 数据 库 设 计 方法 ,基于 视图 概念 的 数据 
库 设 计 方法 等 。 

1) 基于 E-R 模型 的 数据 库 设计 方法 

基于 E-R 模型 的 数据 库 设计 方法 是 由 P. P. S. chen 于 1976 年 提出 的 数据 库 设 计 方法 ， 
其 基本 思想 是 在 需求 分 析 的 基础 上 ,用 E-R 图 构造 一 个 反映 现实 世界 实体 之 间 联 系 的 企业 
模式 ,然后 再 将 此 企业 模式 转换 成 基于 某 一 特定 的 DBMS 的 概念 模式 。 

2) 基于 3NF 的 数据 库 设 计 方法 

基于 3NF 的 数据 库 设 计 方法 是 一 种 结构 化 设计 方法 ,其 基本 思想 是 在 需求 分 析 的 基础 
上 ,确定 数据 库 模 式 中 的 全 部 属性 和 属性 间 的 依赖 关系 ,将 它们 组 织 在 一 个 单一 的 关系 模式 
中 ,然后 再 分 析 模式 中 不 符合 3NF 的 约束 条 件 ,将 其 进行 投影 分 解 ,规范 成 若干 个 3NF 关 
系 模式 的 集合 。 

其 具体 设计 步骤 分 为 以 下 5 个 阶段 。 

(1) 设计 企业 模式 ,利用 规范 化 得 到 的 3NF 关系 模式 画 出 企业 模式 ; 

(2) 设计 数据 库 的 概念 模式 ,把 企业 模式 转换 成 DBMS 所 能 接受 的 概念 模式 ,并 根据 
概念 模式 导出 各 个 应 用 的 外 模式 ; 

(3) 设计 数据 库 的 物理 模式 (存储 模式 ); 

(4) 对 物理 模式 进行 评价 ; 

(5) 实现 数据 库 。 

3) 基于 视图 的 数据 库 设计 方法 

此 方法 先 从 分 析 各 个 应 用 的 数据 着 手 , 其 基本 思想 是 为 每 个 应 用 建立 自己 的 视图 ,然后 
再 把 这 些 视图 汇总 起 来 合并 成 整个 数据 库 的 概念 模式 。 合 并 过 程 中 要 解决 以 下 问题 。 

(1) 消除 命名 冲突 ; 

(2) 消除 元 余 的 实体 和 联系 ; 

(3) 进行 模式 重 构 ,在 消除 了 命名 冲突 和 宛 余 后 ,需要 对 整个 汇总 模式 进行 调整 ,使 其 
满足 全 部 完整 性 约束 条 件 。 

除了 以 上 三 种 方法 外 ,规范 化 设计 方法 还 有 实体 分 析 法 、 属 性 分 析 法 和 基于 抽象 语义 的 
设计 方法 等 。 规 范 设计 法 从 本 质 上 来 说 仍然 是 手工 设计 方法 ,其 基本 思想 是 过 程 迭 代 和 逐 
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3. 计算 机 辅助 设计 法 

计算 机 辅助 设计 法 是 指 在 数据 库 设计 的 某 些 过 程 中 模拟 某 一 规范 化 设计 的 方法 ,并 以 
人 的 知识 或 经 验 为 主导 ,通过 人 机 交互 方式 实现 设计 中 的 某 些 部 分 。 目 前 许多 计算 机 辅助 
软件 工程 工具 可 以 自动 或 辅助 设计 人 员 完 成 数据 库 设 计 过 程 中 的 很 多 任务 ,比如 Sysbase 
公司 的 PowerDesigner 和 Oracle 公司 的 Oracle Designer。 

4. 自动 化 设计 法 

自动 化 设计 法 是 缩短 数据 库 设计 周期 ,加快 数据 库 设计 速度 的 一 种 方法 。 这 种 方法 往 
往 是 直接 用 户 ,特别 是 非 专业 人 员 在 对 数据 库 设 计 专 业 知 识 不 太 熟 悉 的 情况 下 , 较 好 地 完成 
数据 库 设计 任务 的 一 种 捷径 。 例 如 ,设计 人 员 只 要 熟悉 某 种 MIS 辅助 设计 软件 的 使 用 , 通 
过 人 机 会 话 , 输 入 原始 数据 和 有 关 要 求 ,无 须 人 工 干 预 ,就 可 以 由 计算 机 系统 自动 生成 数据 
库 结构 及 相应 的 应 用 程序 。 由 于 该 设计 方法 基于 某 一 MIS 辅助 设计 系统 ,从 而 受 限 于 某 种 
DBMS, 使 得 最 终 产生 的 数据 库 及 其 软件 系统 带 有 一 定 的 局 限 性 。 此 外 ,一 个 好 的 数据 库 模 
型 ,往往 需要 设计 者 与 用 户 反 复 商 讨 , 是 在 用 户 的 参与 及 合作 下 所 形成 的 一 个 最 终结 果 , 设 
计 者 的 经 验 及 对 应 用 部 门 的 熟悉 程度 ,在 很 大 程度 上 是 数据 库 设计 质量 的 关键 。 因 此 ,相对 
于 其 他 设计 方法 而 言 , 自 动 化 设计 法 并 不 是 一 种 理想 的 设计 手段 。 下 面 围绕 规范 化 设计 法 ， 
深入 分 析 和 介绍 其 详细 设计 过 程 。 


5.1.4 数据 库 设 计 的 基本 步骤 


按照 规范 设计 方法 ,考虑 数据 库 及 其 应 用 系统 开发 全 过 程 ,并 仿照 软件 生存 周期 ,将 数 
据 库 设计 分 为 需求 分 析 、 概 念 结构 设计 、 逻 辑 结构 设计 、 物 理 结构 设计 数据库 实施 和 和 运行 维 
护 6 个 阶段 。 数 据 库 设 计 过 程 可 以 用 图 5-1 表示 。 

1. 需求 分 析 

需求 分 析 是 对 具体 应 用 环境 的 业务 流程 和 用 户 提 出 的 各 种 要 求 加 以 调查 研究 和 分 析 ， 
并 和 用 户 共同 对 各 种 原始 数据 加 以 综合 、 整 理 的 过 程 ,是 形成 最 终 设计 目标 的 首要 阶段 ,也 
是 整个 数据 库 设 计 过 程 中 最 困难 的 阶段 。 该 阶段 任务 的 完成 ,将 为 以 后 各 阶段 任务 打下 坚 
实 的 基础 。 因 此 ,对 用 户 的 各 种 需求 及 数据 ,能 否 做 出 准确 无 误 、 充 分 完备 的 分 析 , 并 在 此 基 
础 上 形成 最 终 目标 ,是 整个 数据 库 设 计 成 败 的 关键 。 

2. 概念 结构 设计 

概念 结构 设计 是 对 用 户 信息 需求 所 进行 的 进一步 抽象 和 归纳 ,结果 为 数据 库 概念 结构 ， 
通常 用 E-R 模型 来 表示 。 

数据 库 的 概念 结构 与 DBMS 和 相关 软 硬 件 无 关 , 它 是 对 现实 世界 中 具体 数据 的 抽象 ， 
实现 了 从 现实 世界 到 信息 世界 的 转换 过 程 。 概 念 结构 设计 是 数据 库 设计 的 一 个 重要 环节 ， 
是 数据 库 的 逻辑 结构 设计 和 物理 结构 设计 的 基础 。 

3. 逻辑 结构 设计 

概念 结构 设计 的 结果 是 得 到 一 个 与 DBMS 无 关 的 概念 模式 ,而 多 辑 结构 设计 就 是 将 概 
念 模式 转换 为 与 选用 的 具体 DBMS 所 支持 的 数据 模型 相符 合 的 逻辑 结构 。 所 以 ,在 逻辑 结 
构 设 计 阶 段 选择 什么 样 的 数据 模型 和 哪 一 个 具体 DBMS 尤为 重要 , 它 是 能 否 满足 用 户 各 种 
要 求 的 关键 。 

在 逻辑 结构 设计 阶段 还 有 一 个 很 重要 的 工作 就 是 模式 优化 ,该 工作 主要 以 用 规范 化 理 
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图 5-1 数据 库 设 计 步 又 


论 为 指导 ,目的 是 能 够 合理 存放 数据 集合 。 逻 辑 结构 设计 阶段 的 模式 优化 ,已 成 为 影响 数据 
库 设计 质量 的 一 项 重要 工作 。 

4. 物理 结构 设计 

数据 库 物理 设计 是 将 逻辑 结构 设计 阶段 所 产生 的 逻辑 数据 模型 ,转换 为 某 一 计算 机 系 
统 所 支持 的 数据 库 物 理 结构 的 实现 过 程 。 

数据 库 的 物理 结构 主要 指数 据 库 的 存储 记录 格式 、 存 储 记 录 安 排 和 存储 方法 ,完全 依赖 
于 给 定 的 硬件 环境 .具体 的 DBMS 和 操作 系统 。 

存储 记录 格式 的 设计 包括 记录 的 组 成 ,数据 项 的 类 型 .长 度 , 以 及 逻辑 记录 到 存储 记录 
的 映射 。 存 储 记录 的 安排 是 指 可 以 把 经 常 同时 被 访问 的 数据 组 合 在 一 起 。 存 取 方 法 的 设计 
主要 是 指 存 取 路 径 , 存 取 路 径 分 为 主 存 取 路 径 与 辅 存 取 路 径 , 前 者 用 于 主 码 检索 ,后 者 用 于 
辅助 键 检索 。 
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除 此 之 外 ,物理 结构 设计 还 要 进行 完整 性 和 安全 性 考虑 ,设计 者 应 在 完整 性 、 安 全 性 、 有 
效 性 和 效率 方面 进行 分 析 , 做 出 权衡 。 

完成 物理 结构 设计 后 ,对 该 物理 结构 做 出 相应 的 性 能 评价 , 若 评价 结果 符合 原 设计 要 
求 , 则 进一步 实现 该 物理 结构 。 否 则 ,对 该 物理 结构 做 出 相应 的 修改 , 若 属于 最 初 设计 问题 
所 导致 的 物理 结构 的 缺陷 ,必须 返回 到 概念 设计 阶段 修改 其 概念 数据 模型 或 重新 建立 概念 
数据 模型 ,如 此 反复 ,直至 评价 结果 最 终 满 足 原 设计 要 求 为 止 。 

5. 数据 库 实施 

数据 库 实 施 阶段 , 即 数据 库 调试 、 试 运行 阶段 。 一 旦 数据 库 物理 结构 形成 ,就 可 以 用 已 
选 定 的 DBMS 定义 ,描述 相应 的 数据 库 结 构 , 装 入 数据 库 数据 ,以 生成 完整 的 数据 库 , 编 制 
有 关 应 用 程序 ,进行 联机 调试 并 转 入 试 运 行 ,同时 进行 时 间 、 空 间 等 性 能 分 析 , 若 不 符合 要 
求 , 则 需 调整 物理 结构 ,修改 应 用 程序 ,直至 高 效 、 稳 定 、 正 确 地 运行 该 数据 库 系统 为 止 。 

6. 数据 库 运 行 和 维护 

数据 库 实施 阶段 结束 ,标志 着 数据 库 系 统 投 入 正常 运行 的 开始 。 严 格 地 说 ,数据 库 运 行 
和 维护 不 属于 数据 库 设 计 的 范畴 ,早期 的 新 奥尔良 法 明确 规定 数据 库 设 计 的 4 个 阶段 ,不 包 
括 运行 和 维护 内 容 。 随 着 人 们 对 数据 库 设计 的 深刻 了 解 和 设计 水 平 的 不 断 提高 ,已 经 充分 
认识 到 数据 库 运 行 和 维护 工作 与 数据 库 设 计 的 紧密 联系 。 数 据 库 设计 是 一 种 动态 和 不 断 完 
善 的 运行 过 程 , 运 行 和 维护 阶段 开始 ,并 不 意味 着 设计 过 程 的 结束 ,任何 哪怕 只 有 细微 的 结 
构 改变 ,也许 就 会 引起 对 物理 结构 的 调整 .修改 ,甚至 物理 结构 的 完全 改变 ,因此 数据 库 运 行 
和 维护 阶段 是 保证 数据 库 日 常 活动 的 一 个 重要 阶段 。 


5.2 需求 分 析 


5.2.1 需求 分 析 的 任务 


需求 分 析 的 任务 是 通过 详细 调查 现实 世界 要 处 理 的 对 象 (组 织 .部门 .企业 等 ) ,充分 了 
解 原 系统 (手工 系统 或 计算 机 系统 ) 工 作 概况 ,明确 用 户 的 各 种 需求 ,然后 在 此 基础 上 确定 新 
系统 的 功能 。 新 系统 必须 充分 考虑 今后 可 能 的 扩充 和 改变 ,不 能 仅 按 当前 应 用 需求 来 设计 
数据 库 。 

需求 分 析 的 重点 是 调查 .收集 与 分 析 用 户 在 数据 管理 中 的 信息 要 求 , 处 理 要求 、 安 全 性 

1. 信息 要 求 

信息 要 求 是 指 用 户 需要 从 数据 库 中 获得 信息 的 内 容 与 性 质 。 由 用 户 的 信息 要 求 可 以 导 
出 数据 要 求 , 即 在 数据 库 中 需要 存储 哪些 数据 。 

2. 处 理 要 求 

处 理 要 求 是 指 用 户 要 求 完 成 什么 处 理 功 能 ,如 对 处 理 的 响应 时 间 有 什么 要 求 ,处 理 方式 
是 批 处 理 还 是 联机 处 理 等 。 新 系统 的 功能 必须 能 够 满足 用 户 的 信息 要 求 、 处 理 要 求 。 

3. 安全 性 与 完整 性 要 求 

确定 用 户 的 最 终 需求 其 实 是 一 件 很 困难 的 事 , 这 是 因为 一 方面 用 户 缺 少 计算 机 知识 , 开 
始 时 无 法 确定 计算 机 究竟 能 为 自己 做 什么 :不 能 做 什么 ,因此 无 法 一 下 子 准 确 地 表达 自己 的 


需求 ,他 们 所 提出 的 需求 往往 不 断 地 变化 。 另 一 方面 ,设计 人 员 缺 少 用 户 的 专业 知识 ,不 易 
理解 用 户 的 真正 需求 ,甚至 误解 用 户 的 需求 。 此 外 ,新 的 硬件 ,软件 技术 的 出 现 也 会 使 用 户 需 
求 发 生变 化 。 因 此 设计 人 员 必 须 与 用 户 不 断 深 入 地 进行 交流 ,才能 逐步 确定 用 户 的 实际 需求 。 


5.2.2 需求 分 析 的 方法 和 过 程 


需求 分 析 常 用 的 方法 有 以 下 几 种 。 

(1) 跟班 作业 。 通 过 亲身 参加 业务 工作 来 了 解 业 务 活动 的 情况 。 这 种 方法 可 以 比较 准 
确 地 理解 用 户 的 需求 ,但 比较 耗费 时 间 。 

(2) 开 调 查 会 。 通 过 与 用 户 座谈 来 了 解 业务 活动 情况 及 用 户 需求 。 座 谈 时 ,参加 者 之 
间 可 以 相互 启发 。 

(3) 请 专人 介绍 和 询问 。 对 某 些 调查 中 的 问题 ,可 以 找 专业 人 员 介 绍 情况 并 进行 咨询 。 

(4) 设计 调查 表 请 用 户 填写 。 如 果 调 查 表 设 计 得 合理 ,这 种 方法 是 很 有 效 ,也 很 易于 为 
用 户 接受 。 

(5) 查阅 记录 。 即 查阅 与 原 系统 有 关 的 数据 记录 ,包括 原始 单据 、 账 簿 、 报 表 等 。 

需求 分 析 的 过 程 一 般 如 下 。 

(1) 分 析 用 户 活动 ,产生 业务 流程 图 。 了 解 用 户 当前 的 业务 活动 和 职能 , 理 清 其 处 理 流 
程 。 把 用 户 业务 分 成 若干 个 子 处 理 过 程 ,使 每 个 处 理 功 能 明确 、 界 面 清楚 , 画 出 业务 流程 图 。 

(2) 确定 系统 范围 ,产生 系统 范围 图 。 在 和 用 户 经 过 充分 讨论 的 基础 上 ,确定 计算 机 所 
能 进行 数据 处 理 的 范围 ,确定 哪些 工作 由 人 工 完成 ,哪些 工作 由 计算 机 系统 完成 , 即 确定 人 
机 界面 。 

(3) 分 析 用 户 活 动 所 涉及 的 数据 ,产生 数据 流 图 。 深 入 分 析 用 户 的 业务 处 理 , 以 数据 流 
图 (Data Flow Diagram,DFD) 的 形式 表示 出 数据 的 流向 和 对 数据 所 进行 的 加 工 。DFD 有 
4 个 基本 成 分 : 数据 流 , 加 工 或 处 理 , 文 件 , 外 部 实体 。DFD 可 以 形象 地 表示 数据 流 与 各 业 
务 活动 的 关系 , 它 是 需求 分 析 的 工具 和 分 析 结 果 的 描述 手段 。 

(4) 分 析 系 统 数据 ,产生 数据 字典 (Data Dictionary,DD)。 仅 有 DFD 并 不 能 构成 需求 
说 明 书 ,DFD 只 表示 出 系统 由 哪 几 部 分 组 成 和 各 个 部 分 之 间 的 关系 ,并 没有 说 明 各 个 成 分 
的 含义 。 数 据 字典 提供 对 数据 库 时 间 描 述 的 集中 管理 , 它 的 功能 是 存储 和 检索 各 种 数据 描 
述 ( 元 数据 Metadata) ,数据 字典 是 数据 收集 和 数据 分 析 的 主要 成 果 , 在 数据 库 设计 中 占有 
很 重要 的 地 位 。 

(5) 功能 分 析 。 数 据 库 的 设计 是 与 应 用 系统 的 设计 紧密 结合 的 过 程 ,离开 一 定 的 功能 ， 
数据 库 就 失去 其 存在 的 价值 。 数 据 库 设计 的 一 个 重要 特点 是 结构 (数据 ) 和 行为 (功能 ) 的 结 
合 。 用 户 希 望 系 统 能 提供 的 功能 必须 有 一 个 清晰 的 描述 。 功 能 分 析 可 以 采用 软件 结构 图 或 
模块 图 来 表示 系统 的 层次 分 解 关系 .模块 调用 关系 。 


5.2.3 需求 分 析 常 用 工具 


1. 数据 流 图 
数据 流 图 (Data Flow Diagram,DFD) 是 结构 化 分 析 方 法 中 用 于 表示 系统 逻辑 模型 的 一 
种 工具 , 它 以 图 形 的 方式 描绘 数据 在 系统 中 流动 和 处 理 的 过 程 ,由 于 它 只 反映 系统 必须 完成 
的 逻辑 功能 ,所 以 它 是 一 种 功能 模型 。 
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图 5-2 是 一 个 飞机 机 票 预订 系统 的 数据 流 图 , 它 反映 的 功能 是 : 旅行 社 把 预订 机 票 的 
旅客 信息 (姓名 、 年 龄 .单位 .身份 证 号 码 、 旅 行 时 间 、 目 的 地 等 ) 输 入 机 票 预订 系统 。 系 统 为 
旅客 安排 航班 ,打印 出 取 票 通知 单 ( 附 有 应 交 的 账 款 )。 旅 客 在 飞机 起 飞 的 前 一 天 赁 取 票 通 
知 单 交 款 取 票 ,系统 检验 无 误 ,输出 机 票 给 旅客 。 


| “= 


订 票 信息 
旅行 社 上 上 订 票 音 下 有 效 订 票 单 (一 


航班 目录 


旅行 社 


机 票 文件 


5-2 飞机 机 票 预订 系统 数据 流 图 


DFD 由 以 下 4 个 要 素 组 成 。 

(1) 数据 流 _ 代表 数据 流 的 有 向 线 。 数 据 流 是 数据 在 系统 内 传播 的 路 径 , 因 此 由 一 组 成 
分 固定 的 数据 组 成 。 如 订 票 单 由 旅客 姓名 、 年 龄 .单位 .身份 证 号 .日 期 .目的 地 等 数据 项 组 
成 。 由 于 数据 流 是 流动 中 的 数据 ,所 以 必须 有 流向 ,除了 与 数据 存储 之 间 的 数据 流 不 用 命名 
外 ,数据 流 应 该 用 名 词 或 名 词 短语 命名 。 


02) (fa 人 更 理 ,对 数据 这 进行 条 些 操作 或 变换 每 个 加 工 也 要 有 名 字 ， 


通常 是 动词 短语 ,简明 地 描述 完成 什么 加 工 。 在 分 层 的 数据 流 图 中 ,加 工 还 应 编号 。 

(3) “文件 代表 数据 存储 , 指 暂 时 保存 的 数据 , 它 可 以 是 数据 库 文件 或 任何 形式 的 数据 
组 织 。 

4) | 外 部 实体 | 代表 系统 之 外 的 数据 提供 者 或 使 用 者 ,是 本 软件 系统 外 部 环境 中 的 实体 
(包括 人 员 组织 或 其 他 软件 系统 ) ,统称 外 部 实体 。 一 般 只 出 现在 数据 流 图 的 项 层 。 

画 DFD 的 步骤 如 下 。 

(1) 首先 画 系统 的 输入 输出 , 即 先 画 顶层 数据 流 图 。 项 层 流 图 只 包含 一 个 加 工 , 用 以 表 
示 被 开发 的 系统 ,然后 考虑 该 系统 有 哪些 输入 数据 、 输 出 数据 。 项 层 图 的 作用 在 于 表明 被 开 
发 系统 的 范围 以 及 它 和 周围 环境 的 数据 交换 关系 。 

(2) 画 系统 内 部 结构 , 即 画 下 层 数据 流 图 。 不 能 再 分 解 的 加 工 称 为 基本 加 工 。 一 般 将 
层 号 从 0 开始 编号 ,采用 自 顶 向 下 ,由 外 向 内 的 原则 。 画 0 层 数据 流 图 时 ,分 解 顶层 流 图 的 
系统 为 若干 子 系统 ,确定 每 个 子 系统 间 的 数据 接口 和 活动 关系 。 

画 DFD 时 注意 事项 如 下 。 

(1) 命名 。 不 论 数据 流 ,数据 存储 还 是 加 工 ,合适 的 命名 使 人 们 易于 理解 其 含义 。 


(2) 画 数据 流 而 不 是 控制 流 。 数 据 流 反映 系统 * 做 什么 ”, 不 反映 “如何 做 ,因此 箭头 上 
的 数据 流 名 称 只 能 是 名 词 或 名 词 短语 ,整个 图 中 不 反映 加 工 的 执行 顺序 。 
(3) 一 般 不 画 物质 流 。 数 据 流 反映 能 用 计算 机 处 理 的 数据 ,并 不 是 实物 ,因此 对 目标 系 
统 的 数据 流 图 一 般 不 画 物 质 流 。 
(4) 每 个 加 工 至 少 有 一 个 输入 数据 流 和 一 个 输出 数据 流 , 反 映 出 此 加 工 数据 的 来 源 与 
加 工 的 结果 。 
(5) 编号 。 如 果 一 张 数据 流 图 中 的 某 个 加 工分 解 成 另 一 张 数据 流 图 时 , 则 上 层 图 为 父 
图 ,直接 下 层 图 为 子 图 。 子 图 及 其 所 有 的 加 工 都 应 编号 。 
(6) 父 图 与 子 图 的 平衡 。 子 图 的 输入 输出 数据 流 同 父 图 相应 加 工 的 输入 输出 数据 流 必 
须 一 致 ,此 即 父 图 与 子 图 的 平衡 。 
(7) 局 部 数据 存储 。 当 某 层 数据 流 图 中 的 数据 存储 不 是 父 图 中 相应 加 工 的 外 部 接口 ， 
而 只 是 本 图 中 某 些 加 工 之 间 的 数据 接口 时 , 则 称 这 些 数据 存储 为 局 部 数据 存储 。 
(8) 提高 数据 流 图 的 易 懂 性 。 注 意 合理 分 解 ,要 把 一 个 加 工分 解 成 几 个 功能 相对 独立 
的 子 加 工 ,这 样 可 以 减少 加 工 之 间 输 入 、 输 出 数据 流 的 数目 ,增加 数据 流 图 的 可 理解 性 。 
构造 DFD 的 目的 是 为 了 系统 分 析 师 与 用 户 能 够 进行 明确 的 交流 ,以 便 指 导 系 统 的 设 
计 , 并 为 后 续 工 作 打下 基础 。 所 以 要 求 DFD 既 要 简单 ,又 要 易于 理解 。 构 造 DFD 通常 从 上 
到 下 , 逐 层 分 解 , 直 到 功能 细 化 为 止 ,形成 若干 层次 的 DFD。 
2. 数据 字典 
数据 字典 (Data Dictionary, DD) 是 将 数据 流程 图 中 各 个 要 素 的 具体 内 容 和 特征 ,以 特 
定格 式 记 录 下 来 ,所 形成 的 文档 。 它 主要 包括 : 数据 项 数据 结构 ,数据 流 、 加 工 、 文 件 、 外 部 
实体 等 内 容 。 在 数据 库 设计 过 程 中 ,数据 字典 被 不 断 地 充实 、 修 改 和 完善 。 
对 数据 库 设计 来 讲 , 数 据 字 典 是 进行 数据 收集 和 数据 分 析 所 获得 的 主要 成 果 , 是 各 类 数 
据 描述 的 集合 。 数 据 字典 通常 包括 数据 项 数据 结构 数据 流 、 数 据 存储 和 处 理 过 程 5 个 
部 分 。 
1) 数据 项 
数据 项 是 不 可 再 分 的 数据 单位 。 对 数据 项 的 描述 通常 包括 以 下 内 容 。 
数据 项 描述 = {数据 项 名 ,数据 项 含义 说 明 , 别 名 ,数据 类 型 ,长 度 , 取 值 范围 ， 
取 值 含义 ,与 其 他 数据 项 的 逻辑 关系 } 
其 中 , 取 值 范 围 与 其 他 数据 项 的 逻辑 关系 定义 了 数据 的 完整 性 约束 条 件 , 是 设计 数据 检验 功 
能 的 依据 。 
2) 数据 结构 
数据 结构 反映 了 数据 之 间 的 组 合 关系 。 一 个 数据 结构 可 以 由 若干 个 数据 项 组 成 ,也 可 
以 由 若干 个 数据 结构 组 成 ,或 由 若干 个 数据 项 和 数据 结构 混合 组 成 。 对 数据 结构 的 描述 通 
常 包 括 以 下 内 容 。 
数据 结构 描述 = {数据 结构 名 ,含义 说 明 , 组 成:{ 数 据 项 或 数据 结构 )} 
3) 数据 流 
数据 流 是 数据 结构 在 系统 内 传输 的 路 径 。 对 数据 流 的 描述 通常 包括 以 下 内 容 。 
数据 流 描述 = {数据 流 名 ,说 明 ,数据 流 来 源 , 数 据 流 去 向 ， 
组 成 : {数据 结构 ) ,平均 流量 ,高 峰 期 流量 } 
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其 中 ,数据 流 来 源 是 说 明 该 数据 流 来 自 哪个 过 程 ,数据 流 去 向 是 说 明 该 数据 流 将 到 哪个 
过 程 去 ,平均 流量 是 指 在 单位 时 间 ( 每 天 、 每 周 、 每 月 等 ) 内 的 传输 次 数 ,高 峰 期 流量 则 是 指 在 
高 峰 时 期 的 数据 流量 。 

4) 数据 存储 

数据 存储 是 数据 结构 停留 或 保存 的 地 方 ,也 是 数据 流 的 来 源 和 去 向 之 一 。 对 数据 存储 
的 描述 通常 包括 以 下 内 容 。 

数据 存储 描述 = {数据 存储 名 ,说 明 ,编号 ,流入 的 数据 流 ,流出 的 数据 流 ， 
组 成 : {数据 结构 ) ,数据 量 , 存 取 方 式 } 

其 中 ,数据 量 是 指 每 次 存 取 多 少数 据 , 每 天 (或 每 小 时 ,每 周 等 ) 存 取 几 次 等 信息 。 存 取 方 法 
包括 是 批 处 理 , 还 是 联机 处 理 ; 是 检索 还 是 更 新 ; 是 顺序 检索 还 是 随机 检索 等 。 另 外 ,流入 
的 数据 流 要 指出 其 来 源 , 流 出 的 数据 流 要 指出 其 去 向 。 

5) 处 理 过 程 

数据 字典 中 只 需要 描述 处 理 过 程 的 说 明 性 信息 ,通常 包括 以 下 内 容 。 

处 理 过 程 描述 = {处 理 过 程 名 ,说 明 , 输 入: {数据 流 } ,输出 : {数据 流 }， 
处 理 : {简要 说 明 )} 

其 中 ,简要 说 明 是 指 该 处 理 过 程 的 功能 及 处 理 要 求 。 其 中 ,功能 是 指 该 处 理 过程 用 来 做 什么 
(而 不 是 怎么 做 ) ,处 理 要 求 包括 处 理 频 度 要 求 ,如 单位 时 间 里 处 理 多 少 事务 ,多 少数 据 量 ; 
响应 时 间 要 求 等 。 这 些 处 理 要 求 是 后 面 物理 设计 的 输入 及 性 能 评价 的 标准 。 

数据 字典 是 关于 数据 库 中 数据 的 描述 , 即 元 数据 ,而 不 是 数据 本 身 。 数 据 本 身 将 存放 在 
物理 数据 库 中 ,由 数据 库 管 理 系 统管 理 。 数 据 字 典 有 助 于 这 些 数据 的 进一步 管理 和 控制 ,为 
设计 人 员 和 数据 库 管理 员 在 数据 库 设 计 、 实 现 和 运行 阶段 控制 有 关 数 据 提供 依据 。 


5.2.4 需求 分 析 实 例 


本 节 以 建立 “学 校 管理 信息 系统 ”为 例 , 说 明 数 据 库 设 计 的 步骤 ,各 步骤 中 所 做 的 工作 及 
产生 的 结果 。 

首先 ,在 建立 “学 校 管理 信息 系统 ”的 需求 分 析 阶 段 , 为 了 明确 系统 的 数据 要 求 、 处 理 要 
求 , 安 全 性 和 完整 性 ,需要 明确 “学 校 * 这 个 应 用 环境 的 组 织 结构 和 数据 流程 , 即 学 校 由 哪些 
部 门 组 成 ,各 部 门 的 职能 ,各 部 门 接收 的 数据 ,对 这 些 数据 进行 的 处 理 , 处 理 时 有 哪些 要 求 ， 
处 理 后 产生 的 数据 ,这 些 数据 的 接收 者 是 谁 等 。 通 过 这 些 内 容 的 调查 ,可 以 得 到 目标 系统 的 
系统 结构 图 .数据 流 图 ,对 于 数据 的 要 求 得 到 数据 字典 等 内 容 ,为 应 用 系统 在 概念 结构 设计 
阶段 抽象 出 E-R 图 提供 了 基础 。 

某 校 的 行政 管理 部 门 按照 职能 划分 ,其 主要 的 组 织 结构 图 见 图 5-3。 

各 行政 管理 部 门 由 于 职能 的 不 同 ,管理 的 对 象 也 不 同 ,例如 ,研究 生 院 管理 研究 生 信 息 ; 
人 事 处 负责 师资 队伍 建设 及 人 事 管理 ; 学 生 工 作 处 负责 学 生 事务 管理 及 学 生 资 助 ; 教务 处 
负责 学 生 档案 、 选 课 、 成 绩 查 询 .教师 教学 管理 等 。 各 部 门 之 间 会 有 一 定 的 联系 ,例如 ,教务 
处 需要 同时 处 理学 生 、 课 程 以 及 教师 三 种 对 象 的 信息 ,而 教师 信息 则 主要 由 人 事 处 进行 管 
理 , 教 务 处 只 需要 教师 信息 中 的 部 分 信息 即 可 ; 学 生 工 作 处 也 需要 从 教务 处 获得 学 生 的 相 


学 校 管理 


研究 生 院 学 科 办 教务 处 科技 与 产业 处 


人 事 处 学 生 工作 处 财务 处 


图 5-3 某 校 的 组 织 结构 图 


关 资 料 进行 学 生日 常 活动 . 评 优 及 奖学金 管理 。 所 以 ,部 门 之 间 存 在 着 数据 流动 和 相互 处 理 
的 问题 ,这 就 需要 用 数据 流 图 将 数据 在 各 部 门 之 间 的 流动 和 处 理 情况 表示 清楚 ,对 于 数据 的 
说 明 则 用 数据 字典 进行 表示 。 

在 清楚 了 部 门 之 间 的 相互 关系 之 后 ,就 要 具体 到 某 个 部 门 进行 详细 分 析 了 。 下 面 以 
该 校 教务 处 管理 系统 为 例 , 假 设 该 系统 可 以 分 为 三 个 主要 功能 : 学 籍 管理 ,负责 学 生 的 基 
本 信息 采集 及 学 籍 档 案 管理 ; 专业 建设 ,管理 学 校 各 院 系 的 专业 设置 .培养 计划 课程 管 
理 .教学 大 纲 .教材 选用 等 信息 ; 选课 管理 ,负责 所 有 在 校本 科 生 的 选课 及 成 绩 查询 等 
工作 。 

图 5-4 得 到 的 只 是 高 层次 抽象 的 系统 概貌 ,要 反映 更 详细 的 内 容 , 则 需要 将 各 功能 模 
块 的 划分 进一步 细 化 ,直到 将 系统 的 工作 过 程 表 述 清 楚 为 止 。 在 处 理 功 能 逐 级 分 解 的 同 
时 ,它们 所 使 用 的 数据 也 逐 级 分 解 ,形成 若干 层次 的 数据 流 图 ,数据 流 图 表达 了 对 数据 进 
行 处 理 的 过 程 ,如 图 5-5 一 图 5-9 所 示 。 其 中 ,图 5-5 是 学 籍 管理 子 系统 的 顶层 数据 流 图 ， 
在 这 一 层 ,只 能 看 到 该 子 系统 的 输入 外 部 项 (招生 办 、 辅 导 员 、 教 务 处 ) 与 输出 外 部 项 (使 
用 学 籍 信息 的 相关 部 门 ), 对 于 学 籍 管理 子 系统 中 具体 包含 哪些 功能 ,在 项 层 数据 流 图 中 
是 无 法 看 到 的 。 图 5-6 是 学 籍 管理 子 系统 的 一 级 数据 流 图 ,可 以 看 出 学 籍 管理 子 系统 总 
共 包 括 5 个 功能 : 学 籍 基本 信息 管理 ,学 籍 变 动 管理 、 奖 惩 信息 管理 ,统计 查询 及 报表 打 
印 。 数 据 存储 包括 : 学 籍 信息 表 、 学 籍 变动 表 、 奖 励 信 息 表 和 处 罚 信息 表 , 这 些 静 态 的 数 
据 存储 ,都 是 数据 库 设 计 重点 考虑 的 内 容 。 但 是 ,在 这 一 层 的 数据 流 图 中 ,仍然 无 法 具体 
地 知道 每 个 功能 包含 哪些 操作 。 因 此 在 图 5-7 一 图 5-9 中 ,对 基本 信息 管理 ,学籍 变动 管理 
和 奖惩 信息 管理 三 个 功能 进行 进一步 细 化 ,得 到 相应 功能 的 二 级 数据 流 图 。 显 然 , 二 级 数据 
流 图 对 各 个 功能 具体 实现 的 操作 已 经 非常 明确 了 。 当 然 ,对 于 图 5-9 ,仍然 可 以 对 奖励 信息 
管理 进一步 细 化 ,得 到 三 级 细 化 数据 流 图 ,但 是 对 于 数据 库 设 计 来 说 ,二 级 数据 流 图 已 经 可 
以 清晰 地 看 到 需要 存储 和 管理 的 数据 对 象 了 。 而 对 于 数据 对 象 的 详细 说 明 , 则 使 用 数据 字 


典 来 描述 。 
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图 5-4 教务 管理 子 系统 功能 结构 图 
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5-5 学 籍 管理 子 系统 顶层 数据 流 图 


学 籍 变动 信息 


处 罚 信息 表 
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图 5-6 学籍 管理 子 系统 一 层 数 据 流 图 


入 学 基本 信息 
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5-7 基本 信息 管理 二 层 数 据 流 图 


下 面 以 “学 籍 管 理子 系统 ”为 例 ,简要 说 明 如 何 定义 数据 字典 。 
1. 数据 项 
该 子 系统 涉及 很 多 数据 项 ,其 中 ,“ 学 号 "数据 项 非常 重要 , 它 能 够 唯一 表示 一 个 学 4 


体 , 作 为 学 生 实 体 的 标识 属性 ,可 以 如 下 描述 。 


由 


学 籍 变动 信息 


处 罚 信息 表 


5-9 奖励 管理 二 层 数据 流 图 


数据 项 : 学 号 

含义 说 明 : 唯一 标识 某 个 学 生 

别名 : 学 生 编 号 

类 型 : 字符 型 

长 度 : 8 

取 值 范围 : 00000000 一 99999999 

取 值 含义 : 第 1,2 位 表示 该 学 生 所 在 学 院 ; 第 3,4 位 表示 学 生 入 学 年 份 ; 后 4 位 按 
顺序 编号 

与 其 他 数据 项 的 逻辑 关系 : 能 够 决定 学 生 的 其 他 属性 


2. 数据 结构 
“学 生 ” 是 该 系统 中 的 重要 实体 ,也 是 系统 的 一 个 核心 数据 结构 ,在 实际 操作 中 ,学 生 实 
体 实际 上 就 是 代表 学 生 的 一 条 条 学 籍 信息 , 它 可 以 如 下 描述 。 


数据 结构 : 学 生 
含义 说 明 : 学 籍 管 理子 系统 的 主体 数据 结构 ,定义 了 一 个 学 生 的 在 校 基本 信息 
组 成 : 学 号 十 姓名 十 性 别 十 出 生日 期 十 年 龄 十 学 院 十 专业 十 班级 


3. 数据 流 
数据 流 是 数据 结构 在 系统 内 传输 的 路 径 , 体 现 了 系统 中 对 数据 动态 的 处 理 过 程 及 变化 。 
如 “入 学 基本 信息 ”数据 流 , 来 自 系 统 的 外 部 输入 项 “招生 办 公 室 ”, 流 向 基本 信息 管理 模块 ， 
具体 内 容 描述 如 下 。 


击 吕 油 


数据 亩 设计 


数据 库 原 理 与 应 用 (MySQL 版 ) 


数据 流 : 人 学 基本 信息 

含义 说 明 : 学 生 入 学 时 采集 到 的 基本 信息 
来 源 : 招生 办 公 室 

去 向 : 基本 信息 管理 模块 

组 成 : 身份 证 号 十 姓名 十 性 别 十 出 生日 期 …… 


4. 数据 存储 

系统 中 基本 信息 管理 .学籍 变动 管理 和 奖惩 信息 管理 三 个 功能 都 会 对 相应 的 数据 存储 
进行 操作 ,如 基本 信息 管理 模块 ,会 对 学 籍 信息 表 进 行 读 取 , 同 时 会 对 学 籍 信息 表 进 行 添加 、 
删除 .修改 等 操作 。 数 据 存储 中 的 数据 ,作为 数据 源 ,流向 统计 查询 和 报表 显示 模块 。 具 体 
内 容 如 下 。 


数据 结构 : 学 籍 信息 表 

含义 说 明 : 学 生 在 校 的 学 籍 基本 信息 

流入 数据 流 : 学 生 在 校 基本 信息 

流出 数据 流 : 具体 统计 和 查询 信息 

组 成 : 学 号 十 姓名 十 性 别 十 出 生日 期 十 学 院 十 专业 十 班级 十 宿舍 


5. 处 理 过 程 
处 理 过 程 表示 对 数据 流 的 处 理 功能 和 处 理 要 求 ,如 处 理 过 程 “1. 1 基本 信息 录入 ”可 如 
下 描述 。 


处 理 过 程 : 1. 1 基本 信息 录入 

说 明 : 为 所 有 新 生 录入 在 校 学 籍 信息 

输入 : 入 学 基本 信息 

输出 : 在 校 学 籍 信息 

处 理 : 在 新 生 报到 后 ,根据 录取 专业 ,为 所 有 新 生 录 入 宿舍 、 院 系 、 专 业 、 班 级 等 在 校 


5.3 概念 结构 设计 


5.3.1 概念 结构 设计 的 定义 


概念 模型 可 以 看 成 是 现实 世界 到 机 器 世界 的 一 个 过 渡 的 中 间 层 次 ,在 这 个 层次 中 ,使 用 
接近 计算 机 存储 的 方式 表示 数据 ,同时 又 不 涉及 具体 的 DBMS。 做 出 概念 模型 后 ,再 转换 为 
具体 的 DBMS( 如 SQL Server 或 Oracle) 下 的 模型 ,就 成 为 逻辑 模型 。 在 设计 数据 库 应 用 系 
统 时 ,要 把 现实 世界 的 事物 通过 认识 和 抽象 转换 为 信息 世界 的 概念 模型 ,再 把 概念 模型 转换 
为 机 器 世界 的 数据 模型 。 

概念 模型 是 对 现实 世界 的 一 种 抽象 , 即 对 实际 的 人 、 物 、 事 和 概念 进行 人 为 处 理 , 抽 取 人 
们 关心 的 共同 特性 ,忽略 非 本 质 的 细节 ,并 把 这 些 特性 用 各 种 概念 精确 地 加 以 描述 。 


概念 模型 是 数据 库 系 统 的 核心 和 基础 。 由 于 各 个 机 器 上 实现 的 DBMS 软件 都 是 基于 
某 种 数据 模型 的 ,所 以 在 具体 机 器 上 实现 的 模型 都 有 许多 严格 的 限制 。 而 现实 应 用 环境 是 
复杂 多 变 的 ,如 果 把 现实 世界 中 的 事物 直接 转换 为 机 器 中 的 对 象 ,就 非常 不 方便 。 因 此 ,人 
们 研究 把 现实 世界 中 的 事物 抽象 为 不 依赖 于 具体 机 器 的 信息 结构 ,又 接近 人 们 的 思维 ,并 有 具 
有 丰富 语义 的 概念 模型 ,然后 再 把 概念 模型 转换 为 具体 的 机 器 上 DBMS 支持 的 数据 模型 。 
概念 模型 的 描述 工具 通常 是 使 用 E-R 模型 图 。 该 模型 不 依赖 于 具体 的 硬件 环境 和 DBMS 。 

将 需求 分 析 得 到 的 用 户 需求 抽象 为 信息 结构 即 概念 模型 的 过 程 就 是 概念 结构 设计 。 

对 数据 库 概 念 模型 有 以 下 要 求 。 

(1) 有 丰富 的 语义 表达 能 力 ,能 表达 用 户 的 各 种 需求 。 

(2) 易于 交流 和 理解 ,从 而 可 以 用 它 和 不 熟悉 计算 机 的 用 户 交 换 意 见 。 

(3) 要 易于 更 改 。 当 应 用 环境 和 应 用 要 求 改变 时 ,概念 模型 要 能 很 容易 地 修改 和 扩充 
以 反映 这 种 变化 。 

(4) 易于 向 各 种 数据 模型 转换 。 


5.3.2 概念 结构 设计 方法 


概念 结构 设计 阶段 ,一般 使 用 语义 数据 模型 描述 概念 模型 。 通 常 是 使 用 E-R 模型 图 作 
为 概念 设计 的 描述 工具 进行 设计 。 用 E-R 模型 图 进行 概念 设计 可 以 采用 如 下 方法 。 

1. 集中 式 模式 设计 法 

集中 式 模 式 设计 法 即 首先 定义 全 局 概念 结构 的 框架 ,然后 逐步 细 化 。 例 如 ,可 以 先 确定 
几 个 高 级 实体 类 型 ,然后 在 确定 其 属性 时 ,把 这 些 实体 类 型 分 解 为 更 低 一 层 的 实体 类 型 和 联 
系 。 集 中 式 模式 设计 法 的 设计 过 程 如 图 5-10 所 示 。 


概念 模式 1 概念 模式 n 


概念 模式 1,1 概念 模式 1,m 概念 模式 n,1 概念 模式 n,m 


图 5-10 集中 式 模式 设计 法 


2. 视图 集成 法 

以 各 部 分 的 需求 说 明 为 基础 ,分 别 设计 各 自 的 局 部 模式 ,这 些 局 部 模式 相当 于 各 部 分 的 
视图 ,然后 再 以 这 些 视图 为 基础 ,集成 为 一 个 全 部 模式 。 视 图 是 按照 某 个 用 户 组 ,应 用 或 部 
门 的 需求 说 明 , 用 E-R 数据 模型 设计 的 局 部 模式 。 现 在 的 关系 数据 库 设计 通常 采用 视图 集 
成 法 。 视 图 集成 法 的 设计 过 程 如 图 5-11 所 示 。 

3. 混合 方法 

即将 集中 式 模式 设计 法 和 视图 集成 法 相 结合 ,用 集中 式 模式 设计 法 设计 一 个 全 局 概念 
结构 的 框架 ,以 它 为 骨架 集成 由 视图 集成 法 中 设计 的 各 局 部 概念 结构 。 
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全 局 概念 模式 


概念 模式 1 概念 模式 
概念 模式 1,1 概念 模式 1,m 概念 模式 n,1 概念 模式 n,m | 
子 需 求 1,1 子 需求 1.m 子 需求 n,1 子 需求 n,m 


5-11 视图 集成 法 


4. 由 内 向 外 法 

首先 定义 最 重要 的 核心 概念 结构 ,然后 向 外 扩充 ,考虑 已 存在 概念 附近 的 新 概念 使 得 建 
模 过 程 向 外 扩展 。 使 用 该 策略 ,可 以 先 确定 模式 中 比较 明显 的 一 些 实体 类 型 ,然后 继续 添加 
其 他 相关 的 实体 类 型 ,如 图 5-12 所 示 。 


| 核心 需求 需求 | 


5-12 由 内 向 外 法 


5.3.3 局 部 视图 设计 

1. 局 部 视图 设计 的 方法 

1) 选择 局 部 应 用 

在 需求 分 析 阶 段 ,通过 对 应 用 环境 和 要 求 进行 详尽 的 调查 分 析 , 用 多 层 数据 流 图 和 数据 
字典 描述 了 整个 系统 。 设 计 分 E-R 图 的 第 一 步 ,就 是 要 根据 系统 的 具体 情况 ,在 多 层 的 数 
据 流 图 中 选择 一 个 适当 层次 的 (经 验 很 重要 ) 数 据 流 图 ,使 得 图 中 每 一 部 分 对 应 一 个 局 部 应 
用 ,可 以 就 这 一 层次 的 数据 流 图 为 出 发 点 ,设计 分 E-R 图 。 一 般 而 言 , 中 层 的 数据 流 图 能 较 
好 地 反映 系统 中 各 局 部 应 用 的 子 系统 组 成 ,因此 人 们 往往 以 中 层 数 据 流 图 作为 设计 分 E-R 
图 的 依据 。 

2) 逐一 设计 分 E-R 图 

每 个 局 部 应 用 都 对 应 了 一 组 数据 流 图 ,局 部 应 用 涉及 的 数据 都 已 经 收集 在 数据 字典 中 
了 。 现 在 就 是 要 将 这 些 数据 从 数据 字典 中 抽取 出 来 ,参照 数据 流 图 ,标定 局 部 应 用 中 的 实 
体 、 实 体 的 属性 、 标 识 实体 的 码 ,确定 实体 之 间 的 联系 及 其 类 型 (1 : 1.1 : nwm : n)。 

(1) 标定 局 部 应 用 中 的 实体 。 

现实 世界 中 一 组 具有 某 些 共同 特性 和 行为 的 对 象 就 可 以 抽象 为 一 个 实体 。 对 象 和 实体 


之 间 是 “is member of” 的 关系 。 

例如 ,在 学 校 环境 中 ,可 以 把 张 三 \ 李 四 、 王 五 等 对 象 抽象 为 学 生 实体 。 对 象 类 型 的 组 成 
成 分 可 以 抽象 为 实体 的 属性 。 

组 成 成 分 与 对 象 类 型 之 间 是 “is part of” 的 关系 。 例 如 ,学 号 、 姓 名 、 专 业 \ 年 级 等 可 以 抽 
象 为 学 生 实 体 的 属性 。 其 中 ,学 号 为 标识 学 生 实 体 的 码 。 

(2) 标定 实体 的 属性 、 标 识 实体 的 码 。 

实际 上 ,实体 与 属性 是 相对 而 言 的 ,很 难 有 截然 划分 的 界限 。 同 一 事物 ,在 一 种 应 用 环 
境 中 作为 “属性 ”, 在 另 一 种 应 用 环境 中 就 必须 作为 “实体 ”。 一 般 说 来 ,在 给 定 的 应 用 环境 
中 ,属性 不 能 再 具有 需要 描述 的 性 质 , 即 属性 必须 是 不 可 分 的 数据 项 。 属 性 不 能 与 其 他 实体 
具有 联系 ,联系 只 发 生 在 实体 之 间 。 

(3) 确定 实体 之 间 的 联系 及 其 类 型 (1:1、1:m、 m:n)。 

根据 需求 分 析 , 要 考察 实体 之 间 是 否 存在 联系 ,有 无 多 余 联系 。 

2. 应 用 举例 

继续 以 “教务 管理 系统 ”中 的 “学 籍 管 理子 系统 ”为 例 ,讨论 该 系统 概念 结构 设计 的 过 程 
和 方法 。 在 该 例 中 ,由 学 籍 管理 的 数据 流 图 得 到 的 局 部 应 用 中 , 主要 涉及 的 实体 包括 : 学 
生 、 学 院 、 班 级 .宿舍 专业、 奖励 信息 .处 罚 信息 等 。 那 么 ,这 些 实体 之 间 的 联系 又 是 怎样 
的 呢 ? 

由 于 一 个 宿舍 可 以 住 多 个 学 生 ,而 一 个 学 生 只 能 住 在 某 一 个 宿舍 中 ,一 个 班级 往往 有 若 
干 名 学 生 ,而 一 个 学 生 只 能 属于 一 个 班级 ,个 学 院 包含 多 名 学 生 ， elton 每 
个 专业 方向 有 多 个 班级 ,而 每 个 班级 又 包括 多 名 学 生 , 因 此 各 实体 之 间 的 关系 见 图 5 
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这 些 实体 的 属性 分 别 如 下 (此 处 省 略 了 E-R 图 对 实体 属性 的 表示 ) 。 
学 生 : {学 号 ,姓名 ,性 别 ,出 生日 期 ,年 龄 ,学 院 , 专 业 , 班 级 ,宿舍 } 
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学 籍 信息 : {学 号 ,姓名 ,性 别 ,出 生日 期 ,年 龄 ,学 院 ,专业 ,班级 ,宿舍 } 

学 籍 变动 信息 : { 学 籍 变动 编号 ,学 号 ,姓名 ,变动 类 型 ,变动 时 间 

班级 : {班级 号 ,学 生 人 数 ,班主 任 } 

宿舍 : (宿舍 编号 ,地 址 ,人 数 )} 

学 院 : {学 院 编号 ,学 院 名 称 , 院 长 ,办 公 室 电话 ) 

专业 : (专业 编号 ,专业 名 称 } 

奖励 信息 : {编号 ,学 号 ,奖励 名 称 ,获奖 时 间 , 获 奖 等 级 ,颁奖 单位 

处 罚 信息 : {编号 ,学 号 ,处 罚 名 称 ,处 罚 时 间 , 处 罚 原因 } 

此 处 ,学 生 和 学 籍 信息 为 相同 的 内 容 , 合 并 为 一 个 实体 ,命名 为 学 生 。 因 此 ,学 籍 管理 子 
系统 中 ,共计 8 个 实体 ,9 个 联系 。 


5.3.4 集成 全 局 视图 


1. 视图 集成 要 解决 的 问题 

由 于 局 部 概念 设计 相对 简单 ,因此 简化 了 全 局 模式 的 设计 。 但 是 ,在 将 局 部 视图 合成 为 
全 局 视图 的 时 候 , 需 要 具体 地 解决 下 列 问题 。 

1) 确定 模式 之 间 的 对 应 和 冲突 

由 于 各 子 模式 是 分 开 进行 设计 的 ,因此 有 必要 在 集成 之 前 确定 各 模式 表示 的 是 否 是 同 
一 个 现实 世界 的 概念 结构 。 在 此 过 程 中 ,模式 间 可 能 会 发 生 如 下 一 些 冲 突 。 

(1) 属性 冲突 

@ 属性 域 冲突 , 即 属性 值 的 类 型 、 取 值 范围 或 取 值 集合 不 同 ,如 零件 号 ,有 的 部 门 作为 
整数 对 待 ,有 的 部 门 则 使 用 字符 串 。 不 同 部 门 对 零件 号 的 编码 也 可 能 不 同 。 

@ 属性 取 值 单位 冲突 ,如 零件 重量 ,有 的 部 门 以 千克 为 单位 ,有 的 部 门 以 克 为 单位 。 

(2) 命名 冲突 

包括 同名 异 义 和 异 名 同 义 。 如 科研 项 目 , 财 务 科 称 为 项 目 , 科 研 处 称 为 课题 ,生产 管理 
处 称 为 工程 ,这 就 是 一 个 异 名 同 义 的 例子 。 

(3) 结构 冲突 

@ 同一 对 象 在 不 同 应 用 中 具有 不 同 的 抽象 。 如 在 教学 管理 中 ,职称 是 一 个 属性 ; 而 在 
人 事 管理 中 ,因为 职称 与 工资 、 住 房 挂钩 ,因此 是 一 个 实体 。 

@ 同一 实体 在 不 同 局 部 视图 中 所 包含 的 属性 不 完全 相同 。 

@ 实体 间 的 联系 在 不 同 分 E-R 图 中 为 不 同类 型 ,如 在 生产 子 系统 分 E-R 图 中 ,产品 
和 零件 构成 1 : n 联系。 而 物资 子 系统 分 ER 图 中 ,产品 .零件 .供应 商 三 者 构成 多 对 多 
联系 。 

2) 修改 视图 使 得 相互 一 致 

对 一 些 模式 进行 修改 ,以 便于 其 他 模式 相符 合 。 这 一 步 可 以 解决 上 一 步 发 现 的 冲突 。 

3) 合并 视图 

通过 创建 单个 子 视图 来 创建 全 局 视图 。 相 应 的 概念 在 全 局 模式 中 只 出 现 一 次 ,并 且 要 
确定 子 视图 和 全 局 视图 之 间 的 映射 关系 。 在 涉及 数 百 个 实体 和 联系 的 现实 数据 库 中 ,这 一 
步 是 最 为 困难 的 。 因 为 牵扯 到 大 量 的 人 为 干预 和 协商 来 解决 冲突 ,并 且 要 确定 全 局 模式 的 
一 个 最 为 合理 并 且 能 够 接受 的 解决 方案 。 


4) 重 构 

该 步骤 是 一 个 可 选 步骤 ,可 能 会 对 全 局 模式 进行 分 析 和 重 构 ,以 删除 任何 元 余 和 不 必要 
的 内 容 。 

2. 视图 集成 的 策略 

子 视 图 的 集成 是 一 个 非常 复杂 的 过 程 , 需 要 一 个 更 加 严格 和 系统 化 的 方法 。 下 面 介绍 
一 些 用 于 视图 合并 的 策略 。 

1) 二 元 集成 

首先 对 两 个 比较 类 似 的 模式 进行 集成 。 然 后 把 结果 模式 和 另外 一 个 模式 集成 ,不 断 重 
复 该 过 程 直到 所 有 模式 被 集成 。 可 以 根据 模式 的 相似 程度 确定 模式 集成 的 顺序 。 由 于 集成 
是 逐步 进行 的 ,所 以 该 策略 适用 于 手工 集成 。 

2) nn 元 集成 

对 视图 的 集成 关系 进行 分 析 和 说 明之 后 ,在 一 个 过 程 中 完成 所 有 视图 的 集成 。 对 于 规 
模 较 大 的 设计 问题 ,这 个 策略 需要 使 用 计算 机 化 的 工具 ,目前 有 一 些 这 种 工具 的 原型 ,但 还 
没有 成 熟 的 商业 产品 。 

3) 二 元 平衡 策略 

首先 将 模式 成 对 地 进行 集成 ,然后 再 将 结果 模式 成 对 地 进一步 集成 ,不 断 重复 该 过 程 直 
至 得 到 最 终 的 全 局 模式 。 

4) 混合 策略 

首先 ,根据 模式 的 相似 性 把 它们 划分 为 不 同 的 组 ,对 每 个 组 单独 地 进行 集成 。 然 后 对 中 
间 结 果 进 行 分 组 并 集成 ,重复 该 过 程 直 至 集成 结束 。 

3. 应 用 举例 

将 学 籍 管理 子 系统 的 各 分 E-R 图 进行 合并 的 主要 步骤 如 下 。 

(1) 第 一 步 : 确定 各 模式 之 间 的 对 应 和 冲突 。 

学 籍 管理 子 系统 各 模式 之 间 主 要 存在 命名 冲突 和 结构 冲突 : 学 生 实体 的 属性 { 学 院 , 专 
业 , 班 级 ,宿舍 } 分 别 对 应 “学 院 ? 实 体 的 { 学 院 编号 }“ 专 业 ? 实 体 的 { 专 业 编号 }“ 班 级 ?实体 
的 {班级 编号 ) 和 “宿舍 ”实体 的 {宿舍 编号 ; 。 因 此 ,消除 冲突 后 学 生 实体 表示 为 : 

学 生 : {学 号 ,姓名 ,性 别 ,出 生日 期 ,年 龄 ,学 院 编号 ,专业 编号 ,班级 编号 ,宿舍 编号 } 

(2) 第 二 步 : 消除 存在 着 的 元 余 属 性 和 宛 余 联系 。 

学 生 实体 中 的 年 龄 属性 可 以 由 出 生日 期 推算 出 来 ,属于 元 余 属性 ,应 该 去 掉 。 这 样 不 仅 
可 以 节省 存储 空间 ,而 且 当 某 个 学 生 的 出 生日 期 有 误 ,进行 修改 后 ,无 须 相 应 修改 年 龄 ,减少 
了 产生 数据 不 一 致 的 机 会 。 因 此 ,消除 元 余 属 性 后 学 生 实 体 表示 为 ; 

学 生 : {学 号 ,姓名 ,性 别 , 出 生日 期 ,学 院 编号 ,专业 编号 ,班级 编号 ,宿舍 编号 } 

第 三 步 : 视图 集成 。 集 成 后 的 学 籍 管理 模块 的 E-R 图 如 图 5-14 所 示 。 

学 籍 管理 子 系统 的 E-R 图 还 需要 进一步 和 专业 建设 子 系统 (如 图 5-15 所 示 ) 以 及 选课 
管理 子 系统 (如 图 5-16 所 示 ) 的 E-R 图 合并 ,生成 教务 管理 系统 的 E-R 图 ,由 于 篇 幅 限 制 ， 
这 里 就 不 再 给 出 系统 的 完整 E-R 图 了 , 待 读者 自己 完成 。 

视图 集成 后 形成 一 个 整体 的 数据 库 概 念 结构 ,对 该 整体 概念 结构 还 必须 进行 进一步 验 
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图 5-14 ”学籍 管理 模块 E-R 
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证 ,确保 它 能 够 满足 下 列 条 件 。 

(1) 整体 概念 结构 内 部 必须 具有 一 致 性 , 即 不 能 存在 互相 矛盾 的 表达 。 

(2) 整体 概念 结构 能 准确 地 反映 原来 的 每 个 视图 结构 ,包括 属性 、 实 体 及 实体 间 的 
联系 。 


(3) 整体 概念 结构 能 满足 需求 分 析 阶 段 所 确定 的 所 有 要 求 。 


s.4 ”逻辑 结构 设计 


5.4.1 逻辑 结构 设计 的 任务 和 步骤 


概念 结构 设计 阶段 得 到 的 E-R 模型 是 用 户 的 模型 , 它 独立 于 任何 一 种 数据 模型 ,独立 
于 任何 一 个 具体 的 DBMS。 数 据 库 逻辑 结构 设计 的 任务 是 将 概念 结构 转换 成 特定 DBMS 
所 支持 的 数据 模型 的 过 程 。 从 此 开始 便 进入 了 “实现 设计 ”阶段 ,需要 考虑 到 具体 的 DBMS 
的 性 能 ,具体 的 数据 模型 特点 。 

从 E-R 图 所 表示 的 概念 模型 可 以 转换 成 任何 一 种 具体 的 DBMS 所 支持 的 数据 模型 ,如 
网 状 模型 .层次 模型 和 关系 模型 。 人 逻 辑 结 构 设 计 应 该 选择 最 适 于 描述 与 表达 相应 概念 结构 
的 数据 模型 ,然后 选择 最 合适 的 DBMS。 

逻辑 结构 设计 阶段 需要 完成 的 任务 和 步骤 如 下 。 

(1) 将 E-R 模型 转换 为 等 价 的 关系 模式 。 

(2) 按 需要 对 关系 模式 进行 规范 化 。 

(3) 对 规范 化 后 的 模式 进行 评价 。 

(4) 根据 局 部 应 用 的 需要 ,设计 用 户外 模式 。 

要 使 计算 机 能 够 处 理 E-R 模型 中 的 信息 。 首 先 必 须 将 它 转换 为 具体 的 DBMS 能 处 理 
的 数据 模型 。E-R 模型 可 以 向 现 有 的 各 种 数据 模型 转换 。 而 目前 市 场 上 DBMS 大 部 分 是 
基于 关系 数据 模型 的 ,所 以 本 书 只 详细 讲解 E-R 模型 向 关系 数据 模型 的 转换 方法 。 

从 E-R 图 中 可 以 看 出 ,E-R 模型 实际 上 是 实体 型 及 实体 间 联 系 所 组 成 的 有 机 整体 ,而 
前 面 也 学 过 ,关系 模型 的 逻辑 结构 是 一 系列 关系 模式 的 集合 。 所 以 将 E-R 模型 转换 为 关系 
模型 ,实质 上 就 是 将 实体 型 和 联系 转换 为 关系 模式 。 也 就 是 如 何 用 关系 模式 来 表达 实体 型 
以 及 实体 集 之 间 的 联系 的 问题 。 


5.4.2 EE-R 图 向 关系 模型 的 转换 原则 


关系 模型 的 逻辑 结构 是 一 组 关系 模式 的 集合 。 而 E-R 图 则 是 由 实体 、 实 体 的 属性 和 实 
体 之 间 的 联系 三 个 要 素 组 成 的 。 所 以 将 E-R 图 转换 为 关系 模型 实际 上 就 是 要 将 实体 、 实 体 
的 属性 和 实体 之 间 的 联系 转换 为 关系 模式 。 

E-R 图 向 关系 模型 的 转换 一 般 应 遵循 如 下 原则 。 

1. 实体 的 转换 

一 个 实体 型 转换 为 一 个 关系 模式 。 实 体 的 属性 就 是 关系 的 属性 ,实体 的 码 就 是 关系 
的 码 。 

例如 学生? 实体 可 以 转换 为 如 下 关系 模式 ,其 中 :学 号 为 学 生 关系 的 码 。 

学 生 : (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 编 号 ,专业 编号 ,班级 编号 ,宿舍 编号 ) 

同样 ,学 院 、 专 业 、 班 级 、 宿 舍 、 学 籍 变 动 信息 ,奖励 信息 和 惩罚 信息 等 几 个 实体 都 分 别 转 
换 为 一 个 关系 模式 。 

2. 联系 的 转换 

一 个 联系 转换 为 一 个 关系 模式 ,与 该 联系 相连 的 各 实体 的 码 以 及 联系 的 属性 转换 为 关 
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系 的 属性 ,该 关系 的 码 则 有 以 下 几 种 情况 

(1) 若 联系 为 1: 1, 则 每 个 实体 的 码 均 是 该 关系 的 候选 码 。 

(2) 若 联 系 为 1 : n, 则 关系 的 码 为 n 端 实体 的 码 。 

(3) 车 联系 为 mx : n, 则 关系 的 码 为 诸 实 体 码 的 组 合 。 

(4) 三 个 或 三 个 以 上 实体 间 的 多 元 联系 、 同 一 实体 集 内 的 自 反 联 系 的 转换 规则 与 二 元 
联系 相同 。 

下 面 以 二 元 联系 为 例 ,对 联系 的 转换 规则 进行 详细 的 解释 。 

1) 联系 为 1 : 1 

(1) 转换 为 独立 的 关系 模式 。 如 果 转 换 为 一 个 独立 的 关系 模式 , 则 与 该 联系 相连 的 各 
实体 的 码 以 及 联系 本 身 的 属性 均 转 换 为 关系 的 属性 ,每 个 实体 的 码 均 是 该 关系 的 候选 码 。 

例如 ,图 5-15 中 专业 和 培养 方案 之 间 的 联系 “制定 ”为 1 : 1 类 型 , 则 该 联系 转换 为 独立 
的 关系 模式 时 ,形式 为 : 

制定 (专业 编号 ,培养 方案 编号 ) 

该 联系 的 属性 ,包含 专业 和 培养 方案 两 个 关系 的 码 及 联系 的 属性 (此 处 没有 联系 的 属 
性 )。 该 联系 的 码 , 为 任意 一 方 关系 的 码 , 即 专业 编号 或 者 培养 方案 编号 。 此 处 ,选择 专业 编 
号 为 主 码 。 

(2) 与 关系 模式 合并 。 如 果 与 某 一 端 对 应 的 关系 模式 合并 , 则 需要 在 该 关系 模式 的 属 
性 中 加 入 另 一 个 关系 模式 的 码 和 联系 本 身 的 属性 。 

例如 ,图 5-15 中 专业 和 培养 方案 之 间 的 联系 “制定 ”, 可 以 与 专业 或 者 培养 方案 两 个 关 
系 模式 合并 ,合并 结果 为 下 面 两 种 情况 之 一 。 

专业 (专业 编号 ,专业 名 称 , 所 属 学 院 , 培 养 方案 编号 ) 

培养 方案 (培养 方案 编号 ,内 容 , 制 定 日 期 ,负责 人 ,专业 编号 ) 

在 上 面 的 关系 模式 中 ,用 下 夯 线 表示 主 码 ,波浪 线 表 示 外 码 , 该 外 码 即 为 并 人 的 另 一 方 
关系 模式 的 主 码 。 后 续 的 章节 中 ,如 不 做 特殊 说 明 , 主 外 码 均 用 这 种 方式 表示 。 

2) 联系 为 1 :7 

(1) 转换 为 独立 的 关系 模式 。 如 果 转 换 为 一 个 独立 的 关系 模式 , 则 与 该 联系 相连 的 各 
实体 的 码 以 及 联系 本 身 的 属性 均 转 换 为 关系 的 属性 ,而 关系 的 码 为 n 端 实体 的 码 。 

例如 ,图 5-14 中 专业 和 学 生 之 间 的 联系 “选修 "为 1 : n 类 型 , 则 该 联系 转换 为 独立 的 关 
系 模式 时 ,形式 为 : 

选修 (学 生 编 号 ,专业 编号 ) 

该 联系 的 属性 ,包含 专业 和 学 生 两 个 关系 的 码 及 联系 的 属性 (此 处 没有 联系 的 属性 ) ,该 
联系 的 码 , 为 n 方 关系 的 码 , 即 学 生 编号 。 

(2) 与 关系 模式 合并 。 如 果 与 n 端 对 应 的 关系 模式 合并 , 则 在 n 端 实 体 对 应 模式 中 加 
入 1 端 实 体 所 对 应 关系 模式 的 码 , 以 及 联系 本 身 的 属性 。 而 关系 的 码 为 n 端 实体 的 码 。 

例如 ,图 5-14 中 专业 和 学 生 之 间 的 联系 “选修 ”", 只 能 与 表示 n 方 的 学 生 关 系 模式 合并 ， 
形式 为 : 

学 生 : (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 编号 ,专业 编号 ,班级 编号 ,宿舍 编号 ) 

3) 联系 为 m:n 

m:n 联系 的 转换 方法 只 有 一 种 ,就 是 转换 为 一 个 独立 的 模式 。 与 该 联系 相连 的 各 实 


体 的 码 以 及 联系 本 身 的 属性 均 转换 为 关系 的 属性 。 而 关系 的 码 为 各 实体 码 的 组 合 。 

例如 ,图 5-16 中 学 生 和 课程 之 间 的 “选课 ”联系 是 一 个 m : n 联系 ,可 以 将 它 转 换 为 如 
下 关系 模式 ,其 中 ,学 号 与 课程 号 为 关系 的 组 合 码 ,成 绩 则 是 联系 的 属性 。 

学 习 ( 学 号 ,课程 号 ,成 绩 ,学 期 ) 

3. 具有 相同 码 的 关系 模式 可 合并 

为 了 减少 系统 中 的 关系 个 数 , 如 果 两 个 关系 模式 具有 相同 的 主 码 , 可 以 考虑 将 它们 合并 
为 一 个 关系 模式 。 合 并 方法 是 将 其 中 一 个 关系 模式 的 全 部 属性 加 入 到 另 一 个 关系 模式 中 ， 
然后 去 掉 其 中 的 同 义 属性 (可 能 同名 也 可 能 不 同名 ) ,并 适当 地 调整 属性 的 次 序 。 

按照 上 述 转换 方法 ,学 籍 管理 模块 中 的 9 个 联系 , 若 1 : 1 联系 和 1 :n 联系 按照 转换 为 
独立 关系 模式 的 方法 ,可 以 得 到 下 列 9 个 关系 模式 ,最终 罗 辑 结构 转 换 的 结果 是 9 个 联系 的 
关系 模式 和 8 个 实体 的 关系 模式 的 集合 ,共计 17 个 关系 模式 。 

住宿 (学 生 编号 ,宿舍 编号 ) 

变动 (学 籍 变动 编号 ,学 生 编号 ) 

获奖 (奖励 编号 ,学 生 编 号 ) 

处 罚 ( 处 罚 编号 ,学 生 编 号 ) 

所 在 (学 生 编 号 ,班级 编号 ) 

选修 (专业 编号 ,学 生 编号 ) 

属于 (学 生 编号 ,学院 编号 ) 

包含 (班级 编号 ,专业 编号 ) 

设置 (专业 编号 ,学 院 编号 ) 

若 按照 合并 的 方式 ,学籍 管理 模块 中 的 9 个 联系 转换 得 到 如 下 模式 。 

学 生 : (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 编号 ,专业 编号 ,班级 编号 ,宿舍 编号 ) 

学 籍 变动 信息 : (学 籍 变 动 编号 ,学 号 ,姓名 ,变动 类 型 ,变动 时 间 ) 

班级 : (班级 号 ,班级 名 称 ,学 生 人 数 ,专业 编号 ) 

专业 : (专业 编号 ,专业 名 称 , 学 院 编号 ) 

奖励 信息 :奖励 编号 ,学 号 ,奖励 名 称 ,获奖 时 间 ,获奖 等 级 ,颁奖 单位 ) 

处 罚 信息 : (处罚 编号 ,学 号 ,处 罚 名 称 , 处 罚 时 间 , 处 罚 原 因 ) 

由 于 合并 后 的 关系 模式 包含 部 分 实体 模式 ,因此 最 终 逻 辑 结 构 转 换 的 结果 ,还 应 添加 余 
下 的 两 个 实体 关系 模式 ,因此 这 种 转换 方法 共计 得 到 8 个 关系 模式 。 

宿舍 : {宿舍 编号 ,地 址 ,人 数 } 

学 院 : {学 院 编号 ,学 院 名 称 , 院 长 ,办公室 电话 ) 

从 上 面 两 种 转换 方法 的 结果 可 以 看 出 ,独立 关系 模式 转换 方法 操作 简单 ,结果 清晰 ,但 
是 会 增加 系统 的 存储 空间 , 且 产 生 较 多 的 连接 运算 ,降低 系统 查询 效率 ; 合并 转换 方法 得 到 
的 关系 模式 数量 较 少 ,查询 效率 高 ,但 是 转换 过 程 容易 发 生 遗 漏 。 


5S.4.3 逻辑 结构 的 优化 


应 用 规范 化 理论 对 逻辑 设计 阶段 产生 的 逻辑 模式 进行 初步 优化 ,以 减少 乃至 消除 关 
系 模式 中 存在 的 各 种 异常 ,改善 完整 性 、 一 致 性 和 存储 效率 。 规 范 化 理论 是 数据 库 逻 辑 
设计 的 指南 和 工具 ,规范 化 过 程 分 为 两 个 步骤 : 确定 范式 的 级 别 和 实施 规范 化 处 理 (模式 
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分 解 ) 。 

1. 确定 范式 级 别 

考察 关系 模式 的 函数 依赖 关系 ,确定 范式 等 级 。 找 出 所 有 “数据 字典 ”中 得 到 的 数据 之 
间 的 依赖 关系 ,对 各 模式 之 间 的 数据 依赖 进行 极 小 化 处 理 , 消 除 元 余 的 联系 。 按 照 数据 依赖 
理论 对 关系 模式 逐一 进行 分 析 , 考 察 是 否 存 在 部 分 函数 依赖 传递 函数 依赖 和 多 值 依赖 等 ， 
确定 各 关系 模式 属于 第 几 范 式 。 

例如 ,在 学 籍 变动 信息 模式 中 ,学 号 和 姓名 之 间 存 在 函数 依赖 : 学 号 一 姓名 ,因此 该 关 
系 模式 存在 传递 依赖 关系 ,属于 2NF。 

学 籍 变动 信息 : (学 籍 变动 编号 ,学 号 ,姓名 ,变动 类 型 ,变动 时 间 ) 

2. 实施 规范 化 处 理 

确定 范式 级 别 后 ,根据 应 用 需求 ,判断 它们 对 于 这 样 的 应 用 环境 是 否 合适 ,确定 对 于 这 
些 模式 是 否 进行 合并 或 分 解 。 对 于 上 例 中 的 学 籍 变动 信息 中 存在 的 传递 依赖 关系 , 若 学 生 
姓名 在 此 关系 中 经 常 需 要 被 查询 , 则 可 以 不 对 其 进行 优化 ,保留 在 原 关系 模式 中 ; 若 学 生 姓 
名 较 少 成 为 查询 目标 , 则 可 以 对 将 该 关系 模式 进行 优化 ,结果 为 : 

学 籍 变动 信息 : (学籍 变动 编号 ,学 号 ,变动 类 型 ,变动 时 间 ) 


5.4.4 设计 用 户外 模式 


前 面 根据 用 户 需 求 设计 了 局 部 应 用 视图 ,这 种 局 部 应 用 视图 只 是 概念 模型 ,用 E-R 图 
表示 。 在 将 概念 模型 转换 为 逻辑 模型 后 , 即 生成 了 整个 应 用 系统 的 模式 后 ,还 应 该 根据 局 部 
应 用 需求 ,结合 具体 DBMS 的 特点 ,设计 用 户 的 外 模式 。 

目前 关系 数据 库 管 理 系 统一 般 都 提供 了 视图 概念 ,支持 用 户 的 虚拟 视图 。 可 以 利用 这 
一 功能 设计 更 符合 局 部 用 户 需要 的 用 户外 模式 。 

定义 数据 库 模 式 主要 是 从 系统 的 时 间 效 率 、 空 间 效率 、 易 维护 等 角度 出 发 。 由 于 用 
户外 模式 与 模式 是 独立 的 ,因此 在 定义 用 户外 模式 时 应 该 更 注重 考虑 用 户 的 习惯 与 方 
便 。 包括: 

(1) 使 用 更 符合 用 户 习 惯 的 别名 。 

(2) 对 不 同 级 别 的 用 户 定义 不 同 的 外 模式 ,以 满足 系统 对 安全 性 的 要 求 。 

(3) 简化 用 户 对 系统 的 使 用 。 


5.5 物理 结构 设计 


数据 库 最 终 要 存储 在 物理 设备 上 。 对 于 给 定 的 逻辑 数据 模型 ,选取 一 个 最 适合 应 用 环 
境 的 物理 结构 的 过 程 , 称 为 数据 库 物理 设计 。 物 理 设计 的 任务 是 为 了 有 效 地 实现 逻辑 模式 ， 
确定 所 采取 的 存储 策略 。 此 阶段 是 以 逻辑 设计 的 结果 作为 输入 ,结合 具体 DBMS 的 特点 与 
存储 设备 特性 进行 设计 , 选 定数 据 库 在 物理 设备 上 的 存储 结构 和 存 取 方 法 。 

数据 库 的 物理 设计 可 分 为 以 下 两 步 。 

(1) 确定 物理 结构 ,在 关系 数据 库 中 主要 指 存 取 方 法 和 存储 结构 。 

(2) 对 物理 结构 进行 评价 ,评价 的 重点 是 时 间 和 空间 效率 。 


5.5.1 确定 数据 库 的 物理 结构 


1. 确定 数据 库 的 存储 结构 

确定 数据 库存 储 结构 时 要 综合 考虑 存 取 时 间 、 存 储 空间 利用 率 和 维护 代价 三 方面 的 因 
素 。 这 三 个 方面 常常 是 相互 矛盾 的 ,例如 ,消除 一 切 元 余数 据 虽 然 能 够 节约 存储 空间 ,但 往 
往 会 导致 检索 代价 的 增加 ,因此 必须 进行 权衡 ,选择 一 个 折 中 方案 。 

在 物理 结构 中 ,数据 的 基本 存 取 单 位 是 存储 记录 。 有 了 逻辑 记录 结构 以 后 ,就 可 以 设计 
存储 记录 结构 ,一 个 存储 记录 可 以 和 一 个 或 多 个 逻辑 记录 相对 应 。 存 储 记 录 结 构 包 括 记录 
的 组 成 ,数据 项 的 类 型 和 长 度 , 以 及 逻辑 记录 到 存储 记录 的 映射 。 某 一 类 型 的 所 有 存储 记录 
的 集合 称 为 “文件 ”, 文 件 的 存储 记录 可 以 是 定 长 的 ,也 可 以 是 变 长 的 。 

文件 组 织 或 文件 结构 是 组 成 文件 的 存储 记录 的 表示 法 。 文 件 结构 应 该 表示 文件 格式 、 
逻辑 次 序 ,物理 次 序 ,访问 路 径 、 物 理 设备 的 分 配 。 物 理 数 据 库 就 是 指数 据 库 中 实际 存储 记 
录 的 格式 、 人 逻辑 次 序 和 物理 次 序 访问 路 径 、 物 理 设备 的 分 配 。 

决定 存储 结构 的 主要 因素 包括 存 取 时 间 、 存 储 空 间 和 维护 代价 三 个 方面 。 设 计时 应 当 
根据 实际 情况 对 这 三 个 方面 进行 综合 权衡 。 一 般 DBMS 也 提供 一 定 的 灵活 性 可 供 选择 , 包 
括 聚 秘 和 索引 。 

1) 聚 簇 

聚 簇 就 是 为 了 提高 查询 速度 ,把 在 一 个 (或 一 组 ) 属 性 上 具有 相同 值 的 元 组 集中 地 存放 
在 一 个 物理 块 中 。 如 果 存 放 不 下 ,可 以 存放 在 相 邻 的 物理 块 中 。 其 中 ,这 个 (或 这 组 ) 属 性 称 
为 聚 篮 码 。 聚 徐 有 以 下 两 个 作用 。 

(1) 使 用 聚 簇 以 后 , 聚 篮 码 相同 的 元 组 集中 在 一 起 了 ,因而 聚 徐 值 不 必 在 每 个 元 组 中 重 
复 存储 ,只 要 在 一 组 中 存储 一 次 即 可 ,因此 可 以 节省 存储 空间 。 

(2) 聚 艇 功能 可 以 大 大 提高 按 聚 簇 码 进行 查询 的 效率 。 例 如 ,假设 要 查询 学 生 关系 中 
计算 机 系 的 学 生 名 单 , 设 计算 机 系 有 300 名 学 生 。 在 极端 情况 下 ,这 些 学 生 的 记录 会 分 布 在 
300 个 不 同 的 物理 块 中 ,这 时 如 果 要 查询 计算 机 系 的 学 生 , 就 需要 做 300 次 的 I/O 操作 ,这 
将 影响 系统 查询 的 性 能 。 如 果 按 照 系 别 建立 聚焦 ,使 同一 个 系 的 学 生 记录 集中 存放 , 则 每 做 
一 次 IVO 操作 ,就 可 以 获得 多 个 满足 查询 条 件 的 记录 ,从 而 显著 地 减少 了 访问 磁盘 的 次 数 。 

2) 索引 

存储 记录 是 属性 值 的 集合 ,主键 可 以 唯一 确定 一 个 记录 ,而 其 他 属性 的 一 个 具体 值 不 能 
唯一 确定 是 哪个 记录 。 在 主键 上 应 该 建立 唯一 索引 ,这 样 不 但 可 以 提高 查询 速度 ,还 能 避免 
关系 键 重复 值 的 录入 ,确保 了 数据 的 完整 性 。 

在 数据 库 中 ,用 户 访问 的 最 小 单位 是 属性 。 如 果 对 某 些 非 主 属性 的 检索 很 频繁 ,可 以 考 
虑 建立 这 些 属 性 的 索引 文件 。 索 引文 件 对 存储 记录 重新 进行 内 部 链接 ,从 逻辑 上 改变 了 记 
录 的 存储 位 置 , 从 而 改变 了 访问 数据 的 入 口 点 。 关 系 中 数据 越 多 索引 的 优越 性 也 就 越 明 显 。 
建立 多 个 索引 文件 可 以 缩短 存 取 时 间 ,但 是 增加 了 索引 文件 所 占用 的 存储 空间 以 及 维 
护 的 开销 。 因 此 ,应 该 根据 实际 需要 综合 考虑 。 

2. 确定 访问 方法 

访问 方法 是 为 存储 在 物理 设备 (通常 指 辅 存 ) 上 的 数据 提供 存储 和 检索 能 力 的 方法 。 一 
个 访问 方法 包括 存储 结构 和 检索 结构 两 个 部 分 。 存 储 结构 限定 了 可 能 访问 的 路 径 和 存储 记 
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录 ; 检索 结构 定义 了 每 个 应 用 的 访问 路 径 ,但 不 涉及 存储 结构 的 设计 和 设备 分 配 。 

存储 记录 是 属性 的 集合 ,属性 是 数据 项 类 型 ,可 用 作 主 码 或 辅助 键 。 主 码 唯一 地 确定 了 
一 个 记录 。 辅 助 键 是 用 作 记录 索引 的 属性 ,可 能 并 不 唯一 确定 某 一 个 记录 。 

访问 路 径 的 设计 分 成 主 访问 路 径 与 辅 访 问 路 径 的 设计 。 主 访问 路 径 与 初始 记录 的 装 入 
有 关 , 通 常 是 用 主 码 来 检索 的 。 首 先 利用 这 种 方法 设计 各 个 文件 ,使 其 能 最 有 效 地 处 理 主要 
的 应 用 。 一 个 物理 数据 库 很 可 能 有 几 套 主 访问 路 径 。 辅 访问 路 径 是 通过 辅助 键 的 索引 对 存 
储 记 录 重 新 进行 内 部 链接 ,从 而 改变 访问 数据 的 入 口 点 。 用 辅助 索引 可 以 缩短 访问 时 间 ,但 
增加 了 辅 存 空间 和 索引 维护 的 开销 。 设 计 者 应 根据 具体 情况 做 出 权衡 。 

3. 确定 数据 的 存放 位 置 

为 了 提高 系统 性 能 ,应 该 根据 应 用 情况 将 数据 的 易 变 部 分 稳定 部 分 、 经 常 存 取 部 分 和 
存 取 频率 较 低 部 分 分 开 存 放 。 

例如 ,目前 许多 计算 机 都 有 多 个 磁盘 ,因此 可 以 将 表 和 索引 分 别 存放 在 不 同 的 磁盘 上 ， 
在 查询 时 ,由 于 两 个 磁盘 驱动 器 并 行 工作 ,可 以 提高 物理 读 写 的 速度 。 

在 多 用 户 环境 下 ,可 能 将 日 志文 件 和 数据 库 对 象 ( 表 、 索 引 等 ) 放 在 不 同 的 磁盘 上 ,以 加 
快 存 取 速 度 。 另 外 ,数据 库 的 数据 备份 .日志 文件 备份 等 ,只 在 数据 库 发 生 故 障 进 行 恢 复 时 
才 使 用 ,而 且 数据 量 很 大 ,可 以 存放 在 磁带 上 ,以 改进 整个 系统 的 性 能 。 

4. 确定 系统 配置 

DBMS 产品 一 般 都 提供 了 一 些 系统 配置 变量 ,存储 分 配 参 数 , 供 设计 人 员 和 DBA 对 数 
据 库 进行 物理 优化 。 系 统 为 这 些 变 量 设 定 了 初始 值 , 但 是 这 些 值 不 一 定 适合 每 一 种 应 用 环 
境 , 在 物理 设计 阶段 ,要 根据 实际 情况 重新 对 这 些 变 量 赋值 ,以 满足 新 的 要 求 。 

系统 配置 变量 和 参数 很 多 ,例如 ,同时 使 用 数据 库 的 用 户 数 、 同 时 打开 的 数据 库 对 象 数 、 
内 存 分 配 参数 .缓冲 区 分 配 参 数 (使 用 的 缓冲 区 长 度 . 个 数 )\ 存 储 分 配 参数 .数据 库 的 大 小 、 
时 间 片 的 大 小 、 锁 的 数目 等 ,这 些 参数 值 影 响 存 取 时 间 和 存储 空间 的 分 配 ,在 物理 设计 时 要 
根据 应 用 环境 确定 这 些 参 数值 ,可 以 存放 在 辅助 存储 设备 上 ,以 改进 整个 系统 的 性 能 。 


5.5.2 评价 物理 结构 


数据 库 物 理 设计 过 程 中 需要 对 时 间 效 率 、 空 间 效率 、 维 护 代 价 和 各 种 用 户 要 求 进行 权 
衡 ,其 结果 可 以 产生 多 种 方案 ,数据 库 设 计 人 员 必 须 对 这 些 方案 进行 细致 的 评价 ,从 中 选择 
一 个 较 优 的 方案 作为 数据 库 的 物理 结构 。 

评价 物理 数据 库 的 方法 完全 依赖 于 所 选用 的 DBMS, 主 要 是 从 定量 估算 各 种 方案 的 存 
储 空间 、 存 取 时 间 和 维护 代价 入 手 , 对 估算 结果 进行 权衡 、 比 较 ,选择 出 一 个 较 优 的 合理 的 物 
理 结构 。 如 果 该 结构 不 符合 用 户 需求 , 则 需要 修改 设计 。 


5.6 数据 库 实 施 


数据 库 实 施 是 指 根据 逻辑 设计 和 物理 设计 的 结果 ,在 计算 机 上 建立 起 实际 的 数据 库 结 
构 、 装 入 数据 、 进 行 测试 和 试 运行 的 过 程 。 
数据 库 实施 主要 包括 以 下 工作 。 


1. 建立 实际 数据 库 结 构 

确定 了 数据 库 的 逻辑 结构 与 物理 结构 后 ,就 可 以 用 所 选用 的 DBMS 提供 的 数据 定义 语 
言 (CDDL) 来 严格 描述 数据 库 结构 。 可 使 用 SQL 定义 语句 中 的 CREATE TABLE 语句 定义 
所 需 的 基本 表 , 使 用 CREATE VIEW 语句 定义 视图 。 

2. 组 织 数据 人 库 

装 入 数据 又 称 为 数据 库 加 载 (Loading) ,是 数据 库 实施 阶段 的 主要 工作 。 在 数据 库 结构 
建立 好 之 后 ,就 可 以 向 数据 库 中 加 载 数据 了 。 

由 于 数据 库 的 数据 量 一 般 都 很 大 ,它们 分 散 于 一 个 企业 (或 组 织 ) 中 各 个 部 门 的 数据 文 
件 、 报 表 或 多 种 形式 的 单据 中 ,存在 着 大 量 的 重复 ,并 且 其 格式 和 结构 一 般 都 不 符合 数据 库 
的 要 求 ,必须 把 这 些 数据 收集 起 来 加 以 整理 ,去 掉 宛 余 并 转换 成 数据 库 所 规定 的 格式 ,这 样 
处 理 之 后 才能 装 人 数据 库 。 因 此 ,需要 耗费 大 量 的 人 力 、 物 力 , 是 一 种 非常 单调 乏味 而 又 意 
义 重 大 的 工作 。 

由 于 应 用 环境 和 数据 来 源 的 差异 ,所 以 不 可 能 存在 普遍 通用 的 转换 规则 , 现 有 的 DBMS 
并 不 提供 通用 的 数据 转换 软件 来 完成 这 一 工作 。 

对 于 一 般 的 小 型 系统 , 装 和 数据 量 较 少 ,可 以 采用 人 工 方法 来 完成 。 其 步骤 如 下 。 

1) 筛选 数据 

需要 装 人 数据 库 中 的 数据 通常 都 分 散在 各 个 部 门 的 数据 文件 或 原始 凭证 中 ,所 以 首先 
必须 把 需要 人 库 的 数据 筛选 出 来 。 

2) 转换 数据 格式 

筛选 出 来 的 需要 入 库 的 数据 ,其 格式 往往 不 符合 数据 库 要 求 ,还 需要 进行 转换 。 这 种 转 
换 有 时 可 能 很 复杂 。 

3) 输入 数据 

将 转换 好 的 数据 输入 计算 机 中 。 

4) 校 验 数据 

检查 输入 的 数据 是 否 有 误 。 

但 是 ,人 工 方法 不 仅 效率 低 ,而 且 容 易 产 生 差错 。 对 于 数据 量 较 大 的 系统 ,应 该 由 计算 
机 来 完成 这 一 工作 。 通 常 是 设计 一 个 数据 输入 子 系统 ,其 主要 功能 是 从 大 量 的 原始 数据 文 
件 中 筛选 分类、 综合 和 转换 数据 库 所 需 的 数据 ,把 它们 加 工 成 数据 库 所 要 求 的 结构 形式 ,最 
后 装 和 人 数据库 中 ,同时 还 要 采用 多 种 检验 技术 检查 输入 数据 的 正确 性 。 

为 了 保证 装 和 人 数据库 中 数据 的 正确 无 误 , 必 须 高 度 重视 数据 的 校 验 工 作 。 在 输入 子 系 
统 的 设计 中 应 该 考虑 多 种 数据 检验 技术 ,在 数据 转换 过 程 中 应 使 用 不 同 的 方法 进行 多 次 检 
验 ,确认 正确 后 方 可 入 库 。 

如 果 在 数据 库 设计 时 ,原来 的 数据 库 系 统 仍 在 使 用 , 则 数据 的 转换 工作 是 将 原来 老 系统 
中 的 数据 转换 成 新 系统 中 的 数据 结构 。 同 时 还 要 转换 原来 的 应 用 程序 ,使 之 能 在 新 系统 下 
有 效 地 运行 。 

数据 的 转换 、 分 类 和 综合 常常 需要 多 次 才能 完成 ,因而 输入 子 系统 的 设计 和 实施 是 很 复 
杂 的 ,需要 编写 许多 应 用 程序 ,由 于 这 一 工作 需要 耗费 较 多 的 时 间 , 为 了 保证 数据 能 够 及 时 
入 库 , 应 该 在 数据 库 物 理 设计 的 同时 编制 数据 输入 子 系统 ,而 不 能 等 物理 设计 完成 后 才 
开始 。 
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3. 编制 与 调试 应 用 程序 

数据 库 应 用 程序 的 设计 属于 一 般 的 程序 设计 范畴 ,但 数据 库 应 用 程序 有 自己 的 一 些 特 
点 。 例 如 ,大 量 使 用 屏幕 显示 控制 语句 ,形式 多 样 的 输出 报表 ,重视 数据 的 有 效 性 和 完整 性 
检查 ,有 灵活 的 交互 功能 。 

数据 库 应 用 程序 如 果 要 将 数据 库 中 的 数据 及 各 种 查询 结果 显示 在 应 用 程序 中 ,首先 需 
要 建立 应 用 程序 与 数据 库 之 间 的 连接 ,主要 的 数据 库 连 接 方 式 有 以 下 几 种 。 

1) ODBC 数据 库 接口 

ODBC 即 开 放 式 数据 库 互 连 (Open Database Connectivity) ,是 微软 公司 推出 的 一 种 实 
现 应 用 程序 和 关系 数据 库 之 间 通 信 的 接口 标准 。 符 合 标准 的 数据 库 就 可 以 通过 SQL 编写 
的 命令 对 数据 库 进行 操作 ,但 只 针对 关系 数据 库 。 目 前 所 有 的 关系 数据 库 都 符合 该 标准 (如 
SQL Server,Oracle, Access,Excel 等 )。ODBC 本 质 上 是 一 组 数据 库 访问 API( 应 用 程序 编 
程 接口 ), 由 一 组 函数 调用 组 成 ,核心 是 SQL 语句 ,其 结构 图 如 图 5-17 所 示 。 


ODBC 应 用 程序 
ODBC 驱 动 程序 管理 器 
1 1 1 
Oracle ODBC 驱 动 程序 SQL Server ODBC 驱 动 程序 | Excel ODBC 驱 动 程序 
了 1 了 
Oracle DBMS SQL Server DBMS Excel DBMS 
| t 
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2) OLE DB 数据 库 接口 

OLE DB 即 数 据 库 链接 和 幅 入 对 象 (Object Linking and Embedding DataBase)。OLE 
DB 是 微软 提出 的 基于 COM 思想 且 面向 对 象 的 一 种 技术 标准 ,目的 是 提供 一 种 统一 的 数据 
访问 接口 访问 各 种 数据 源 。 这 里 所 说 的 “数据 ?除了 标准 的 关系 型 数据 库 中 的 数据 之 外 ,还 
包括 邮件 数据 ` Web 上 的 文本 或 图 形 、 目 录 服 务 (Directory Services) ,以 及 主机 系统 中 的 文 
件 和 地 理 数 据 以 及 自 定义 业务 对 象 等 。OLE DB 标准 的 核心 内 容 就 是 提供 一 种 相同 的 访问 
接口 ,使 得 数据 的 使 用 者 (应 用 程序 ) 可 以 使 用 同样 的 方法 访问 各 种 数据 ,而 不 用 考虑 数据 的 
具体 存储 地 点 、 格 式 或 类 型 ,其 结构 图 如 图 5-18 所 示 。 
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图 5-18 ”OLE DB 访问 数据 库 接口 


3) ADO 数据 库 接口 

ADO(CActiveX Data Objects) 是 微软 公司 开发 的 基于 COM 的 数据 库 应 用 程序 接口 , 通 
过 ADO 连接 数据 库 , 可 以 灵活 地 操作 数据 库 中 的 数据 。 

图 5-19 展示 了 应 用 程序 通过 ADO 访问 SQL Server 数据 库 接口 。 从 图 中 可 看 出 ,使 用 
ADO 访问 SQL Server 数据 库 有 两 种 途径 : 一 种 是 通过 ODBC 驱动 程序 , 另 一 种 是 通过 
SQL Server 专用 的 OLE DB Provider, 后 者 有 更 高 的 访问 效率 。 
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图 5-19 ADO 访问 SQL Server 的 接口 


4) ADO. NET 数据 库 接口 

ASP. NET 使 用 ADO. NET 数据 模型 。 该 模型 从 ADO 发 展 而 来 ,但 它 不 只 是 对 ADO 
的 改进 ,而 是 采用 了 一 种 全 新 的 技术 。 主 要 表现 在 以 下 几 个 方面 。 

(1) ADO. NET 不 是 采用 ActiveX 技术 ,而 是 与 .NET 框架 紧密 结合 的 产物 。 

(2) ADO. NET 包含 对 XML 标准 的 完全 支持 ,这 对 于 跨 平台 交换 数据 具有 重要 的 

(3) ADO. NET 既 能 在 与 数据 源 连接 的 环境 下 工作 ,又 能 在 断 开 与 数据 源 连 接 的 条 件 
下 工作 。 特 别 是 后 者 ,非常 适合 于 网 络 应 用 的 需要 。 因 为 在 网 络 环境 下 ,保持 与 数据 源 连 
接 ,不 符合 网 站 的 要 求 ,不 仅 效 率 低 , 付 出 的 代价 高 ,而 且 常 常会 引发 由 于 多 个 用 户 同时 访问 
带 来 的 冲突 。 因 此 ,ADO. NET 系统 集中 主要 精力 用 于 解决 在 断 开 与 数据 源 连 接 的 条 件 下 
数据 处 理 的 问题 。 

ADO. NET 提供 了 面向 对 象 的 数据 库 视图 ,并且 在 ADO. NET 对 象 中 封装 了 许多 数 
据 库 属性 和 关系 。 最 重要 的 是 ,ADO. NET 通过 很 多 方式 封装 和 隐藏 了 很 多 数据 库 访问 的 
细节 。 可 以 完全 不 知道 对 象 在 与 ADO. NET 对 象 交 互 ,也 不 用 担心 数据 移动 到 另外 一 个 数 
据 库 或 者 从 另 一 个 数据 库 获 得 数据 的 细节 问题 。 如 图 5-20 所 示 为 ADO. NET 架构 。 

5) JDBC 数据 库 接口 

JDBC(Java Data Base Connectivity) 是 由 Java Soft 公司 开发 的 ,以 一 组 Java 语言 编写 
的 用 于 数据 库 连 接 和 操作 的 类 和 接口 ,可 为 多 种 关系 数据 库 提 供 统 一 的 访问 方式 。 通 过 
JDBC 完成 对 数据 库 的 访问 包括 4 个 主要 组 件 : Java 应 用 程序 ,JDBC 驱动 器 管理 器 ,驱动 
器 和 数据 源 。 

在 JDBC 的 API 中 有 两 层 接口 : 应 用 程序 层 和 驱动 程序 层 。 前 者 使 开发 人 员 可 以 通过 
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5-20 通过 ADO. NET 访问 数据 库 的 接口 模型 


SQL 调用 数据 库 和 取得 结果 ,后 者 处 理 与 具体 数据 库 驱 动 程序 的 所 有 通信 。 

使 用 JDBC 接口 对 数据 库 操 作 具 有 如 下 优点 。 

(1) JDBC 的 API 与 ODBC 十 分 相似 ,有 利于 用 户 理解 ; 

(2) 使 编程 人 员 从 复杂 的 驱动 器 调用 命令 和 函数 中 解脱 出 来 ,而 致力 于 应 用 程序 功能 
的 实现 ， 

(3) JDBC 支持 不 同 的 关系 数据 库 ,增强 了 程序 的 可 移植 性 。 

使 用 JDBC 的 主要 缺点 : 访问 数据 记录 的 速度 会 受到 一 定 影响 ,此 外 ,由 于 JDBC 结构 
中 包含 不 同 厂家 的 产品 ,这 给 数据 源 的 更 改 带 来 了 较 大 麻烦 。 

4. 数据 库 试 运行 

应 用 程序 编写 完成 ,并 有 了 一 小 部 分 数据 装 和 后 ,应 该 按照 系统 支持 的 各 种 应 用 分 别 试 
验 应 用 程序 在 数据 库 上 的 操作 情况 ,这 就 是 数据 库 的 试 运行 阶段 ,或 者 称 为 联合 调试 阶段 。 
在 这 一 阶段 要 完成 两 方面 的 工作 : 功能 测试 ,实际 运行 应 用 程序 ,测试 它们 能 否 完成 各 种 
预定 的 功能 ; @ 性 能 测试 ,测量 系统 的 性 能 指标 ,分 析 系 统 是 否 符合 设计 目标 。 

系统 的 试 运行 对 于 系统 设计 的 性 能 检验 和 评价 是 很 重要 的 ,因为 有 些 参数 的 最 佳 值 只 
有 在 试 运行 后 才能 找到 。 如 果 测 试 的 结果 不 符合 设计 目标 , 则 应 返回 到 设计 阶段 ,重新 修改 
设计 和 编写 程序 ,有 时 甚至 需要 返回 到 逻辑 设计 阶段 ,调整 逻辑 结构 。 

由 于 数据 装 和 的 工作 量 很 大 ,所 以 可 分 期 分 批 地 组 织 数 据 装 入 , 先 输入 小 批量 数据 做 调 
试用 , 待 试 运行 基本 合格 后 ,再 大 批量 输入 数据 ,逐步 增加 数据 量 ,逐步 完成 运行 评价 。 

数据 库 的 实施 和 调试 不 是 几 天 就 能 完成 的 ,需要 有 一 定 的 时 间 。 在 此 期 间 由 于 系统 还 
不 稳定 ,随时 可 能 发 生硬 件 或 软件 故障 .加 之 数据 库 刚 刚 建立 ,操作 人 员 对 系统 还 不 熟悉 ,对 
其 规律 缺乏 了 解 , 容 易 发 生 操作 错误 ,这 些 故 障 和 错误 很 可 能 破坏 数据 库 中 的 数据 ,这 种 破 
坏 很 可 能 在 数据 库 中 引起 连锁 反应 ,破坏 整个 数据 库 。 

因此 必须 做 好 数据 库 的 转 储 和 恢复 工作 :要 求 设计 人 员 熟 悉 DBMS 的 转 储 和 恢复 功 
能 ,并 根据 调试 方式 和 特点 首先 加 以 实施 ,尽量 减少 对 数据 库 的 破坏 ,并 简化 故障 恢复 。 


s.7 数据 库 的 运行 和 维护 


数据 库 试 运行 结果 符合 设计 目标 后 ,数据 库 就 可 以 真正 投入 运行 了 。 数 据 库 投入 运行 
标志 着 开发 任务 的 基本 完成 和 维护 工作 的 开始 ,并 不 意味 着 设计 过 程 的 终结 ,由 于 应 用 环境 
在 不 断 变 化 ,数据库 运行 过 程 中 物理 存储 也 会 不 断 变化 ,对 数据 库 设计 进行 评价 .调整 .修改 
等 维护 工作 是 一 个 长 期 的 任务 ,也 是 设计 工作 的 继续 和 提高 。 

在 数据 库 运 行 阶段 ,对 数据 库 经 常 性 的 维护 工作 主要 是 由 DBA 完成 的 , 它 包 括 : 

1. 数据 库 的 转 储 和 恢复 

定期 对 数据 库 和 日 志文 件 进行 备份 ,以 保证 一 旦 发 生 故 障 , 能 利用 数据 库 备 份 及 日 志文 
件 备份 ,尽快 将 数据 库 恢 复 到 某 种 一 致 性 状态 ,并 尽 可 能 减少 对 数据 库 的 破坏 。 

2. 数据 库 的 安全 性 完整 性 控制 

DBA 必须 对 数据 库 安 全 性 和 完整 性 控制 负 起 责任 。 根 据 用 户 的 实际 需要 授予 不 同 的 
操作 权限 。 另 外 ,由 于 应 用 环境 的 变化 ,数据 库 的 完整 性 约束 条 件 也 会 变化 ,也 需要 DBA 
不 断 修正 ,以 满足 用 户 要 求 。 

按照 设计 阶段 提供 的 安全 规范 和 故障 恢复 规范 ,DBA 要 经 常 检 查 系统 的 安全 是 否 受 到 
侵犯 ,根据 用 户 的 实际 需要 授予 用 户 不 同 的 操作 权限 。 

数据 库 在 运行 过 程 中 ,由 于 应 用 环境 发 生变 化 ,对 安全 性 的 要 求 可 能 发 生变 化 ,DBA 要 
根据 实际 情况 及 时 调整 相应 的 授权 和 密码 ,以 保证 数据 库 的 安全 性 。 

同样 ,数据 库 的 完整 性 约束 条 件 也 可 能 会 随 应 用 环境 的 改变 而 改变 ,这 时 DBA 也 要 对 
其 进行 调整 ,以 满足 用 户 的 要 求 。 

另外 ,为 了 确保 系统 在 发 生 故 障 时 能 够 及 时 地 进行 恢复 ,DBA 要 针对 不 同 的 应 用 要 求 
定制 不 同 的 转 储 计划 ,定期 对 数据 库 和 日 志文 件 进行 备份 ,以 使 数据 库 在 发 生 故障 后 恢复 到 
某 种 一 致 性 状态 ,保证 数据 库 的 完整 性 。 

3. 数据 库 性 能 的 监督 .分析 和 改进 

目前 许多 DBMS 产品 都 提供 了 监测 系统 性 能 参数 的 工具 ,DBA 可 以 利用 这 些 工具 方 
便 地 得 到 系统 运行 过 程 中 一 系列 性 能 参数 的 值 。DBA 应 该 仔细 分 析 这 些 数据 ,通过 调整 某 
些 参数 来 进一步 改进 数据 库 性 能 。 经 常 对 数据 库 的 存储 空间 状况 及 响应 时 间 进 行 分 析 评 
价 ; 结合 用 户 的 反应 情况 确定 改进 措施 ; 及 时 改正 运行 中 发 现 的 错误 ; 按 用 户 的 要 求 对 数 
据 库 的 现 有 功能 进行 适当 的 扩充 。 

4. 数据 库 的 重组 织 和 重 构造 

数据 库 运 行 一 段 时 间 后 ,由 于 记录 的 不 断 增加 、 删 除 和 修改 ,会 改变 数据 库 的 物理 存储 
结构 ,使 数据 库 的 物理 特性 受到 破坏 ,从 而 降低 数据 库存 储 空间 的 利用 率 和 数据 的 存 取 效 
率 , 使 数据 库 的 性 能 下 降 。 因 此 ,需要 对 数据 库 进行 重新 组 织 , 即 重新 安排 数据 的 存储 位 置 ， 
回收 垃圾 ,减少 指针 链 , 改 进 数据 库 的 响应 时 间 和 空间 利用 率 , 以 提高 系统 性 能 。 这 与 操作 
系统 对 “磁盘 碎片 ”的 处 理 的 概念 相 类 似 。 

数据 库 的 重组 只 是 使 数据 库 的 物理 存储 结构 发 生变 化 ,而 数据 库 的 逻辑 结构 不 变 , 所 以 
根据 数据 库 的 三 级 模式 ,可 以 知道 数据 库 重组 对 系统 功能 没有 影响 ,只 是 为 了 提高 系统 的 
性 能 。 
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数据 库 应 用 环境 的 变化 可 能 导致 数据 库 的 逻辑 结构 发 生变 化 ,比如 要 增加 新 的 实体 , 增 
加 某 些 实体 的 属性 ,这 样 实体 之 间 的 联系 发 生 了 变化 ,使 原 有 的 数据 库 设计 不 能 满足 新 的 要 
求 ,必须 对 原来 的 数据 库 重新 构造 ,适当 调整 数据 库 的 模式 和 内 模式 ,比如 要 增加 新 的 数据 
项 ,增加 或 删除 索引 ,修改 完整 性 约束 条 件 等 。 

DBMS 一 般 都 提供 了 重新 组 织 和 构造 数据 库 的 应 用 程序 ,以 帮助 DBA 完成 数据 库 的 
外 组 和 重 构 工作 。 

只 要 数据 库 系 统 在 运行 ,就 需要 不 断 地 进行 修改 、 调 整 和 维护 。 一 旦 应 用 变化 太 大 , 数 
据 库 重新 组 织 也 无 济 于 事 ,这 就 表明 数据 库 应 用 系统 的 生命 周期 结束 ,应 该 建立 新 系统 , 重 
新 设计 数据 库 。 从 头 开始 进行 数据 库 设 计 工作 ,标志 着 一 个 新 的 数据 库 应 用 系统 生命 周期 
的 开始 。 


jm 


5.8 数据 库 设计 实例 


为 了 具体 说 明 数 据 库 的 设计 方法 ,本 节选 取 两 个 实例 对 数据 库 的 设计 过 程 进 行 说 明 。 
为 了 突出 数据 库 设 计 的 特点 ,重点 强调 了 概念 结构 设计 和 逻辑 结构 设计 的 方法 和 步骤。 当 
然 , 要 能 够 熟练 掌握 数据 库 设 计 的 技巧 ,还 必须 综合 软件 工程 的 知识 ,以 及 实际 应 用 环境 的 
知识 ,将 理论 和 实践 相 结 合 , 才 能 设计 出 满足 要 求 的 数据 库 应 用 系统 。 

实例 1: 某 公司 公开 招聘 职员 管理 系统 

第 一 步 : 需求 分 析 。 

假设 用 户 需 求情 况 如 下 。 

某 公司 准备 公开 招聘 若干 个 公司 部 门 经 理 和 职员 ,为 了 使 招聘 工作 公开 化 ,公司 需要 进 
行 报名 ,考试 (笔试 面试 ) 公布 考试 结果 等 工作 。 

要 求 每 个 需要 报考 的 人 员 填 写 报考 人 员 登 记 表 ,登记 表 主 要 内 容 有 准 考证 号 .身份 证 
号 姓名 ,年 龄 .性别 、 学 历 .单位 名 称 、 单 位 负责 人 、 政 治 面貌 ; 对 于 每 个 报考 人 员 要 详细 填 
写 工 作 经 历 ,包括 时 间 、 地 点 、 职 务 、 证 明 人 ; 一 个 人 可 以 报考 多 个 职位 ,每 个 职位 可 以 有 多 
个 人 报名 参加 考试 ; 一 个 人 报考 一 个 职位 就 对 应 一 个 面试 成 绩 和 笔试 成 绩 ; 描述 报考 职位 
的 属性 有 职位 代码 、 职 位 名 称 。 

第 二 步 : 概念 结构 设计 。 

从 需求 分 析 的 结果 中 ,抽象 出 实体 、 实 体 属 性 和 实体 之 间 的 联系 , 见 图 5-21 一 图 5-24。 


报考 人 员 政治 面貌 


| 


图 5-21 “报考 人 员 ? 实 体 及 属性 


报考 职位 工作 经 历 


图 5-22 “报考 职位 ?实体 及 属性 图 5-23 “工作 经 历 ” 实 体 及 属性 


报考 人 员 | 1 | 工作 经 历 


5-24 实体 之 间 的 联系 图 


合并 E-R 图 后 ,报考 职位 和 报考 人 员 之 间 以 * 报 名 成 绩 ” 作 为 联系 ,联系 的 属性 包括 “ 笔 
试 成 绩 ” 和 “面试 成 绩 ”。 

第 三 步 : 逻辑 设计 。 

(1) 将 上 一 步 概念 结构 设计 的 结果 (图 5-24) 转 换 到 关系 模型 ,得 到 如 下 结果 。 

报考 职位 (职位 代码 ,名 称 ) 

报考 人 员 ( 准 考证 号 ,身份 证 号 ,姓名 ,年 龄 ,性 别 ,学 历 , 单 位 名 称 , 单 位 负责 人 ,政治 
面貌 ) 

工作 经 历 (编号 ,开始 时 间 ,结束 时 间 , 姓 名 ,地 点 ,职务 ,证 明 人 , 准 考证 ) 

报名 成 绩 ( 职 位 代码 , 准 考证 号 ,笔试 成 绩 ,面试 成 绩 ) 

在 上 面 的 4 个 关系 模式 中 ,下 夯 线 标明 的 是 关系 模式 的 主 码 ,波浪 线 标明 的 是 关系 模式 
的 外 码 。 特 别 说 明 对 于 报考 人 员 关 系 模式 ,有 两 个 候选 码 : 准 考证 号 和 身份 证 号 。 在 该 报 
考 管理 系统 中 ,从 实际 操作 方面 考虑 ,选择 “ 准 考证 号 ”作为 报考 人 员 这 个 关系 模式 的 主 码 。 

(2) 关系 模式 的 优化 。 

分 析 上 面 的 关系 模式 ,发 现 只 有 在 关系 模式 “报考 人 员 ” 中 ,存在 着 如 下 的 传递 函数 
依赖 。 

准 考证 号 一 单位 名 称 

准 考证 号 一 单位 负责 人 

单位 名 称 一 单位 负责 人 

因为 关系 模式 “报考 人 员 ? 不 存在 部 分 函数 依赖 ,所 以 该 模式 属于 2NF。 将 该 关系 模式 
进行 分 解 得 到 下 面 两 个 子 模式 。 
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报考 人 员 ( 准 考证 号 ,身份 证 号 ,姓名 ,年 龄 ,性别 ,学 历 ,单位 名 称 ,政治 面貌 ) 

单位 (单位 名 称 , 单 位 负责 人 ) 

其 他 的 关系 模式 均 属 于 3NF。 

实例 2: 医院 管理 信息 系统 

第 一 步 : 需求 分 析 。 

假设 某 医院 需求 情况 如 下 。 

医院 有 若干 科室 ,科室 包括 科室 编号 .名 称 、 人 数 、 地 点 、 负 责 人 。 医 院 每 一 个 科室 负责 
若干 个 病房 ,有 若干 名 医生 ,医生 包括 医生 编号 、 姓 名、 职务 、 学 历 、 职 称 、 简 历 ,每 个 医生 的 简 
历 包括 简历 编号 .开始 时 间 、 终 止 时 间 、 单 位 担任 职务 、 证 明 人 。 一 个 医生 要 负责 几 个 病房 
病人 的 医疗 工作 ,每 个 病房 又 可 以 有 多 个 医生 为 
病人 治疗 ,但 一 个 病人 只 能 由 一 个 医生 负责 。 对 
于 病人 ,医院 关心 病人 编号 姓名 性别、 年 龄 , 住 
院 时 间 、 出 院 时 间 \ 病 因 等 信息 ,对 于 病房 关心 病 
房 号 、 床 位 数 、 床 位 号 、 床 位 是 否 为 空 等 信息 。 

第 二 步 : 概念 结构 设计 。 

通过 需求 分 析 , 可 以 得 到 系统 中 的 实体 包括 
医生 ,科室 、 简 历 、 病 人 和 病房 ,实体 及 实体 的 属 图 5-25 “医生 ”实体 及 属性 


性 如 图 5-25 一 图 5-29 所 示 ,实体 之 间 的 联系 如 


图 5-30 所 示 。 


简历 编号 
姓名 开始 时 间 终止 时 间 


图 5-26 “科室 ”实体 及 属性 图 5-27 “简历 ”实体 及 属性 
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图 5-28 “病人 ”实体 及 属性 图 5-29 “病房 ”实体 及 属性 
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5-30 系统 总 ER 图 


在 合并 各 关系 模式 时 ,注意 到 病房 的 属性 “床位 是 否 为 空 ” 可 以 由 病人 的 属性 “病房 号 ” 
“床位 号 "以 及 “住院 时 间 … 出 院 时 间 ” 确 定 , 即 某 个 病人 在 住院 期 间 的 “病房 号 "和 “床位 号 ” 
可 以 确定 该 病床 是 否 为 空 ,所 以 “床位 是 否 为 空 "是 元 余 属性 ,应 该 将 其 去 除 。 

第 三 步 ; 逻辑 结构 设计 。 

(1) 首先 根据 图 5-30 的 总 E-R 图 ,将 实体 转换 为 对 应 的 关系 模式 。 

医生 (医生 编号 ,姓名 ,职称 ,职务 ,学 历 ) 

科室 (科室 编号 ,科室 名 称 , 人 数 ,位 置 ,负责 人 ) 

简历 (简历 编号 ,医生 姓名 ,单位 ,职务 ,开始 时 间 , 终 止 时 间 , 证 明 人 ) 

病人 (病人 编号 ,姓名 ,性 别 ,出 生日 期 ,住院 时 间 , 出 院 时 间 , 病 因 ) 

病房 (病房 号 ,床位 号 ,病床 数 ) 

其 次 ,将 联系 采用 合并 的 方式 进行 转换 ,得 到 下 列表 示 联 系 的 模式 集合 。 

医生 (医生 编号 ,姓名 ,职称 ,职务 ,学 历 ,科室 编号 ) 

简历 (简历 编号 ,医生 编号 ,医生 姓名 ,单位 ,担任 职务 ,开始 时 间 ,终止 时 间 , 证 明 人 ) 

病人 (病人 编号 ,姓名 ,性 别 ,年 龄 ,住院 时 间 ,出 院 时 间 , 病 因 , 病 房 编号 ,床位 号 , 医 
生 编号 ) 

病房 (病房 号 ,床位 号 ,病床 数 ,科室 编号 ) 

负责 (病房 号 ,医生 编号 ,负责 时 间 ) 

最 后 ,将 实体 和 联系 转换 的 结果 合并 ,得 到 最 终 的 逻辑 模式 集合 。 

医生 (医生 编号 ,姓名 ,职称 ,职务 ,学 历 ,科室 编号 ) 

科室 (科室 编号 ,科室 名 称 ,人 数 ,位 置 ,负责 人 ) 

简历 (简历 编号 ,医生 编号 ,医生 姓名 ,单位 ,担任 职务 ,开始 时 间 , 终 止 时 间 , 证 明 人 ) 

病人 (病人 编号 ,姓名 ,性 别 ,年 龄 ,住院 时 间 , 出 院 时 间 , 病 因 , 病 房 编号 ,床位 号 ,医生 
编号 ) 

病房 (病房 号 ,床位 号 ,病床 数 ,科室 编号 ) 

负责 (病房 号 ,医生 编号 ,负责 时 间 ) 
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(2) 关系 模式 的 优化 。 

在 “简历 ”模式 中 ,存在 :“ 简 历 编号 医生 姓名 ”的 传递 依赖 ,而 “简历 "模式 属于 2NF， 
为 了 满足 3NF 的 要 求 ,将 “医生 姓名 ”属性 从 “简历 ”模式 中 删除 。 其 他 关系 模式 都 满足 
3NF ,不 再 需要 进一步 优化 。 
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本 章 从 “软件 工程 ”的 角度 讨论 了 数据 库 设计 的 6 个 阶段 。 在 本 章 的 学 习 过 程 中 ,除了 
要 掌握 书 中 讨论 的 基本 原理 和 方法 外 ,还 要 主动 地 尝试 在 实际 应 用 中 运用 这 些 思想 解决 具 
体 问题 ,这 样 将 实践 和 理论 相 结 合 , 才 能 设计 出 符合 应 用 需求 的 数据 库 应 用 系统 。 


习 题 5 


5.1 名 词 解释 。 

数据 库 设 计 基于 3NF 的 数据 库 设计 方法 ”基于 E-R 模型 的 数据 库 设计 方法 
什么 是 数据 库 设计 ? 试 述 数据 库 设 计 的 步骤 。 

试 述 数 据 库 设计 需求 分 析 阶 段 的 任务 和 方法 。 

数据 流 图 和 数据 字典 的 内 容 和 作用 分 别 是 什么 ? 

视图 集成 时 ,分 E-R 图 之 间 的 冲突 有 哪些 ? 解决 这 些 冲 突 的 方法 是 什么 ? 
试 述 数据 库 逻 辑 结构 设计 的 步骤 。 

试 述 E-R 图 转换 成 关系 模型 的 转换 规则 。 

规范 化 理论 对 数据 库 设计 有 什么 指导 意义 ? 

试 述 数 据 库 逻 辑 结 构 设 计 结 果 的 优化 方法 。 

10” 试 述 数 据 库 物理 结构 设计 的 内 容 和 步 又 。 

11 数据 库 实施 阶段 的 主要 任务 是 什么 ? 

12 数据 库 系 统 投 入 运行 后 ,有 哪些 维护 工作 ? 

.13 某 商业 集团 管理 系统 的 数据 库 信息 如 下 。 

该 系统 中 包含 三 个 实体 集 : 一 是 “仓库 ?实体 集 , 属 性 有 仓库 号 、 仓 库 名 和 地 址 等 ; 二 是 
“商店 ”实体 集 ,属性 有 商店 号 、 商 店名 、 地 址 等 ; 三 是 “商品 ”实体 集 ,属性 有 商品 号 、 商 品名 、 
单价 。 设 仓库 与 商品 之 间 存 在 “库存 ”联系 ,每 个 仓库 可 存储 若干 种 商品 ,每 种 商品 存储 在 若 
干 仓库 中 ,每 个 仓库 每 存储 一 种 商品 有 存储 日 期 及 存储 量 ; 商店 与 商品 之 间 存 在 着 “销售 ” 
联系 ,每 个 商店 可 销售 若干 种 商品 ,每 种 商品 可 在 若干 商店 里 销售 ,每 个 商店 销售 一 种 商品 
有 月 份 和 月 销售 量 两 个 属性 。 

请 在 上 述 背 景 介 绍 的 基础 上 ,完成 如 下 数据 库 设 计 。 

(1) 试 画 出 E-R 图 ,并 在 图 上 注 明 联系 类 型 。 

(2) 将 E-R 图 转换 成 满足 3NF 的 关系 模式 ,并 标识 主 外 键 ( 用 下 画 线 标识 主 码 ,用 波浪 
线 标识 外 键 ) 。 

5.14 ， 现 针 对 学 生 参 与 教师 的 科研 项 目 建立 “科研 项 目 管理 数据 库 系统 ”, 其 中 ,学 生 信 
息 包括 学 号 ,姓名 ,性 别 ,所 在 学 院 ; 学 院 信 息 包括 学 院 编号 ,学 院 名 称 , 办 公 电 话 ; 教师 信 
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息 包括 教师 编号 ,姓名 ,性 别 ,职称 ,所 在 学 院 ; 项 目 信息 包括 项 目 编号 ,项 目 名 称 , 开 始 时 
间 ,结束 时 间 ,项 目 负责 人 ,职称 。 各 实体 之 间 的 关系 为 : 一 个 学 生 可 以 参与 教师 的 多 个 项 
目 ,一 个 项 目 可 以 有 多 个 学 生 参 加 ,每 个 学 生 选 定 项 目 后 要 承担 相应 的 任务 ; 一 个 教师 可 以 
主持 多 个 项 目 ,一 个 项 目 只 能 由 一 个 教师 作为 项 目 负责 人 。 

请 在 上 述 背景 介绍 的 基础 上 ,完成 如 下 数据 库 设 计 。 

(1) 画 出 “科研 项 目 管理 数据 库 系统 ”的 E-R 图 。 

(2) 将 E-R 图 转换 为 一 组 符合 3NF 要 求 的 关系 模式 ,并 标 出 每 个 关系 模式 的 主 外 键 
(用 下 夯 线 标识 主 码 ,用 波浪 线 标识 外 键 ) 。 

5.15 某 工厂 零件 管理 系统 的 需求 分 析 如 下 。 

(1) 一 个 车 间 有 多 个 工人 ,每 个 工人 有 职工 号 、 姓 名 \ 年 龄 ,性别 、 工 种; 

(2) 一 个 车 间 生 产 多 种 产品 ,产品 有 产品 号 ,价格 ; 

(3) 一 个 车 间 生 产 多 种 零件 ,一 种 零件 也 可 能 为 多 个 车 间 制 造 , 零 件 有 零件 号 .重量 、 
价格 ; 

(4) 一 种 产品 由 多 种 零件 组 成 ,一 种 零件 也 可 装配 到 多 种 产品 中 ,产品 与 零件 均 存 人 仓 
库 中 ; 

(5) 三 内 有 多 个 仓库 ,仓库 有 仓库 号 .主任 姓名 .电话 。 

请 在 上 述 背景 介绍 的 基础 上 ,完成 如 下 数据 库 设 计 。 

(1) 请 画 出 该 系统 的 E-R 图 。 

(2) 给 出 相应 的 关系 模型 ,并 标 出 每 个 关系 模式 的 主 外 键 (用 下 面 线 标识 主 码 , 用 波浪 
线 标识 外 键 ) 。 

5.16 ”设计 一 个 学 校 的 图 书 管理 系统 ,请 给 出 该 系统 的 需求 分 析 并 进行 数据 库 设计 , 具 
体 要 求 为 : 

(1) 实体 数 不 少 于 5 个 ,每 个 实体 有 属性 3 一 6 个 ,实体 之 间 的 关系 至 少 要 包含 1 : 7， 
m:n 两 种 联系 类 型 。 

(2) 给 出 该 系统 的 E-R 图 。 

(3) 将 E-R 图 转换 为 一 组 符合 3NF 要 求 的 关系 模式 ,并 标识 主 外 键 (用 下 面 线 标识 主 
码 , 用 波浪 线 标识 外 键 ) 。 


数据 亩 设计 


击 吕 沽 


第 6 章 数据 库 保 护 


数据 库 是 按照 特定 数据 模型 组 织 存储 在 一 起 的 相关 联 的 数据 集合 ,通过 数据 库 管 理 系 
统 实现 多 用 户 数 据 查 询 共 享 。 在 多 用 户 共享 环境 下 ,数据 库 管理 系统 必须 保证 数据 库 发 生 
故障 时 能 够 及 时 正确 地 恢复 ,保证 多 个 用 户 访问 数据 库 时 不 会 互相 干扰 ,保证 数据 不 会 被 非 
法 泄漏 、 更 改 或 者 破坏 ,保证 数据 库 中 数据 的 正确 性 和 相 容 性 。 
数据 库 管 理 系统 ,提供 了 一 系列 功能 用 以 实施 数据 库 保护 ,包括 以 下 4 个 方面 。 
(1) 备份 和 恢复 : 保证 数据 库 发 生 故障 时 能 够 恢复 到 正确 状态 。 
(2) 并 发 控制 : 保证 多 用 户 并 发 访问 数据 时 操作 的 正确 性 。 
(3) 安全 性 控制 : 防止 数据 泄漏 .错误 更 新 和 越权 使 用 等 问题 。 
(4) 完整 性 控制 : 保证 数据 的 正确 性 有 效 性 和 一 致 性 。 
数据 库 保护 ,一 方面 是 在 数据 库 系统 正常 运行 时 保护 数据 对 象 的 安全 性 和 完整 性 ; 另 
一 方面 是 保护 每 个 用 户 所 做 的 每 一 项 工作 任务 能 够 正确 完成 ,即使 是 数据 库 系 统 发 生 故 障 
或 者 多 用 户 并 发 访问 数据 库 。 这 里 , 用户 所 做 的 每 一 项 工作 任务 ,可 以 用 “事务 
(Transaction)” 的 概念 来 表达 ,一 个 事务 是 一 个 原子 的 ,不 可 分 割 的 工作 任务 单位 。 


6.1 事 务 


6.1.1 事务 的 概念 


事务 ,是 将 一 组 数据 库 操 作 打包 起 来 形成 一 个 逻辑 独立 的 工作 单元 ,这 个 工作 单元 不 可 
分 割 ,其 中 包含 的 数据 库 操 作 要 么 全 部 都 发 生 ,要 么 全 部 都 不 发 生 。 

例如 ,日 常生 活 中 买 东西 就 是 一 个 事务 ,该 事务 包含 两 个 操作 : 付 钱 和 拿 东西 。 这 两 个 
操作 必须 打包 在 一 起 才能 组 成 一 个 买 东西 事务 ,不 可 分 割 。 组 成 事务 的 操作 要 么 全 发 生 ,要 
么 全 不 发 生 , 即 或 者 付 钱 拿 走 东西 或 者 没 付 钱 没 拿 东 西 ,事务 执行 都 没有 问题 。 但 是 ,如 果 
付 了 钱 却 没 拿 东西 ,或 者 没 付 钱 就 拿 走 东 西 ,是 顾客 或 商家 不 可 接受 的 。 

在 程序 中 ,事务 是 由 开始 和 结束 标记 之 间 的 全 体操 作 组 成 的 不 可 分 割 的 程序 执行 单元 ， 
通常 事务 开始 标记 和 结束 标记 类 似 于 BEGIN TRANSACTION 和 END TRANSACTION。 

在 SQL 中 ,界定 事务 的 语句 有 以 下 三 条 。 

—— BEGIN TRANSACTION; // 开 始 一 个 事务 ,事务 开始 标记 


—— COMMIT; // 提 交 当 前 事务 ,成 功 结束 标记 
—— ROLLBRCK; // 撤 销 当 前 事务 , 失败 结束 标记 


BEGIN TRANSACTION 标志 事务 开始 执行 ,COMMIT 或 ROLLBACK 标志 事务 


结束 。 
其 中 ,COMMIT 表示 事务 提交 ,事务 成 功 结束 , 即 事务 的 所 有 操作 都 已 经 成 功 完成 ,并 
且 事 务 对 数据 库 已 经 形成 永久 的 更 新 影响 ,数据 库 从 事务 执行 前 的 一 致 状态 进入 一 个 新 的 
一 致 状态 。 即 使 系统 发 生 故 障 , 该 状态 也 会 永久 保持 。 

ROLLBACK 表示 事务 撤销 或 回 滚 ,事务 失败 结束 , 即 事务 中 的 某 些 操作 不 能 顺利 完成 
导致 事务 中 止 ,一 旦 事务 失败 中 止 就 必须 撤销 事务 对 数据 库 所 造成 的 任何 改变 ,回复 到 事务 
开始 执行 前 的 数据 库 状态 ,因此 事务 撤销 又 称 事务 回 滚 。 
注意 “事务 的 所 有 操作 成 功 完成 ?并 不 等 价 于 * 事 务 成 功 完 成 ”。 事 务 的 所 有 操作 成 功 
完成 ,只 表示 事务 中 最 后 一 个 操作 成 功 执行 完成 ,此 时 操作 虽然 已 经 执行 完成 ,但 是 操作 的 
输出 可 能 还 驻 留 在 主 存 中 没有 及 时 写 入 物理 磁盘 ,如 果 发 生 故 障 , 则 事务 对 数据 库 的 更 新 影 
响 依然 可 能 会 丢失 ,因此 不 能 称 之 为 事务 成 功 完成 。 

在 “事务 的 所 有 操作 成 功 完成 "之 后 ,只 有 当 数 据 库 系统 在 物理 磁盘 上 已 经 记录 了 足够 
多 的 信息 ,此 时 即使 发 生 故障 (假设 故障 不 引起 磁盘 数据 丢失 ) ,事务 对 数据 库 的 更 新 也 能 够 
重建 并 永久 保持 下 去 。 


6.1.2 事务 的 将 性 


一 个 逻辑 独立 的 工作 单元 要 成 为 事务 ,必须 满足 4 个 特性 : 原子 性 (Atomicity) ,一 致 性 
(Consistency) ,隔离 性 (Isolation) 和 持久 性 (Durability)。 这 4 个 基本 特性 刻画 出 了 事务 的 
本 质 , 简 称 事务 的 ACID 特性 。 

1. 原子 性 

原子 性 ,是 指 事务 的 不 可 分 割 性 ,组 成 事务 的 所 有 操作 要 么 全 部 被 执行 ,要 么 全 部 不 执 
行 。 如 果 因 为 故障 导致 事务 没有 完成 , 则 该 事务 中 已 经 完成 的 操作 被 认为 是 无 效 的 ,不 应 该 
对 数据 库 产 生 任何 影响 ,在 故障 恢复 时 必须 撤销 它 对 数据 库 的 影响 。 

保证 原子 性 是 数据 库 管理 系统 本 身 的 职责 ,由 DBMS 的 事务 子 系统 来 实现 。 

2. 一 致 性 

一 致 性 ,是 指 在 事务 执行 之 前 和 执行 之 后 数据 库 都 必须 处 于 一 致 性 状态 , 即 事务 的 执行 
使 得 数据 库 从 一 个 一 致 性 状态 转变 到 另 一 个 一 致 性 状态 。 所 谓 数据 库 的 一 致 性 状态 ,就 是 
数据 库 中 的 数据 满足 完整 性 约束 。 例 如 , 某 银行 一 个 账户 的 存款 与 取款 之 差 应 该 等 于 余额 ， 
如 果 存 款 或 取款 时 不 修改 余额 ,就 会 使 数据 库 处 于 不 一 致 状态 。 

事务 的 一 致 性 ,可 以 由 包含 事务 的 应 用 程序 来 保证 ,也 可 以 由 DBMS 通过 检查 完整 性 
约束 来 自动 完成 。 

3. 隔离 性 

隔离 性 ,是 指 多 个 事务 并 发 执行 时 必须 相互 独立 ,不 能 互相 干扰 。 并 发 执行 的 事务 不 必 
关心 其 他 事务 ,就 如 同 在 单 用 户 环 境 下 事务 一 个 接 一 个 顺序 执行 一 样 。 
事务 的 隔离 性 是 由 DBMS 的 并 发 控制 子 系统 实现 的 。 

4. 持久 性 

持久 性 也 称 持 续 性 ,是 指 已 经 提交 的 事务 对 数据 库 的 改变 应 该 是 永久 的 、 持 续 存 在 的 。 
即便 以 后 系统 发 生 故 障 , 事 务 的 这 种 影响 也 不 应 该 丢失 。 

事务 的 持久 性 是 由 DBMS 的 恢复 管理 子 系统 实现 的 。 
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事务 及 其 ACID 特性 是 数据 库 保护 技术 实施 的 基础 概念 ,企业 级 数据 库 管理 系统 必须 
提供 事务 支持 并 保证 其 ACID 特性 。DBMS 的 恢复 和 并 发 控制 机 制 , 主 要 目标 就 是 在 事务 
并 发 执行 时 和 在 系统 发 生 故 障 时 仍然 满足 事务 的 ACID 特性 。 


6.2 ”数据库 恢复 


数据 库 恢 复 ,是 指 把 数据 库 从 一 个 错误 状态 恢复 到 某 一 已 知 的 正确 状态 ( 即 一 致 状态 或 
完整 状态 ) 的 功能 ,DBMS 必须 具有 此 项 功能 。 

根据 事务 的 原子 性 和 持久 性 ,对 于 提交 的 事务 ,DBMS 必须 保证 以 下 两 者 之 一 。 

(1) 或 者 成 功 完 成 事务 中 的 所 有 操作 ,并 且 这 些 操 作 所 产生 的 影响 永久 记录 在 数据 
库 中 ; 

(2) 或 者 该 事务 没有 对 数据 库 或 者 其 他 事务 造成 任何 影响 。 

在 系统 无 故障 且 程 序 顺利 运行 的 情况 下 ,实现 上 述 目标 比较 容易 。 但 是 , 当 系 统 发 生 故 
障 时 ,有 些 事务 可 能 还 没有 完成 而 被 迫 中 止 ,这 些 未 完成 的 事务 所 做 的 操作 可 能 已 对 数据 库 
造成 影响 ,使 数据 库 处 于 不 一 致 的 状态 ; 还 有 一 些 事务 虽然 已 经 提交 ,但 是 结果 还 没有 完全 
持久 到 数据 库 中 。DBMS 的 恢复 机 制 必须 针对 这 两 种 情况 分 别处 理 。 

(1) 未 完成 事务 : 撤销 未 完成 事务 对 数据 库 的 一 切 影响 ,保证 事务 的 原子 性 。 

(2) 已 提交 事务 : 恢复 事务 对 数据 库 的 更 新 影响 ,保证 事务 的 持久 性 。 

DBMS 所 采用 的 恢复 技术 是 否 行 之 有 效 , 不 仅 对 系统 的 可 靠 程度 起 着 决定 性 的 作用 ， 
而 且 对 系统 的 运行 效率 也 有 很 大 影响 ,是 衡量 系统 性 能 优 劣 的 重要 指标 。 


6.2.1 数据 库 系统 的 故障 


数据 库 系 统 中 可 能 发 生 的 故障 很 多 ,归纳 起 来 大 致 可 以 分 为 4 类 : 事务 内 部 故障 ,系统 
故障 ,介质 故障 和 计算 机 病毒 。 

1. 事务 内 部 故障 

事务 内 部 故障 ,是 指 在 当前 事务 内 部 操作 执行 过 程 中 可 能 发 生 的 故障 ,可 以 分 为 预期 故 
障 和 非 预期 故障 两 种 。 

(1) 预期 故障 , 即 在 程序 中 程序 员 应 该 预先 估计 到 并 加 以 处 理 的 错误 。 

例如 ,在 仓库 管理 中 , 当 库 存量 比 要 出 库 的 物品 数量 小 的 时 候 , 如 果 继 续 操作 就 会 出 现 
问题 。 这 种 情况 可 以 事先 在 程序 代码 中 增加 逻辑 判断 和 ROLLBACK 语句 。 当 事务 执行 到 
ROLLBACK 语句 时 ,由 系统 对 事务 进行 回 滚 操作 , 即 撤销 事务 对 数据 库 的 一 切 影响 ,保证 
事务 的 原子 性 ,或 者 称 为 执行 UNDO 操作 。 

(2) 非 预 期 故障 , 即 在 程序 运行 中 发 生 的 无 法 预 估 并 能 预 处 理 的 错误 。 

例如 ,运算 溢出 ,并 发 执行 事务 发 生死 锁 , 因 系 统 调度 上 的 需要 而 选择 中 止 某 些 事务 等 。 
这 些 故障 无 法 预 估 并 处 理 , 必 须 由 DBMS 直接 执行 UNDO 处 理 。 

2. 系统 故障 

系统 故障 ,又 称 软 故障 ,是 指 造成 系统 停止 运转 并 要 求 系统 重新 启动 的 事件 。 造 成 系统 
故障 的 原因 很 多 ,比如 CPU 故障 、 操 作 系 统 故障 、 突 然 断 电 等 。 系 统 故 障 影响 正在 运行 的 
所 有 事务 ,但 不 破坏 数据 库 。 发 生 系统 故障 后 ,系统 必须 重新 启动 ,内 存 中 数据 库 工作 区 内 


的 数据 可 能 丢失 ,但 存储 在 外 存储 器 设备 上 的 数据 库 数据 不 会 草 到 破坏 。 

系统 故障 导致 所 有 正在 运行 的 事务 都 以 非 正常 方式 中 止 , 造 成 数据 库 处 于 不 一 致 状态 。 
因此 ,在 恢复 系统 时 ,应 让 所 有 非 正 常 中 止 的 事务 回 滚 ,强行 撤销 所 有 未 完成 的 事务 ,把 数据 
库 恢 复 到 正确 状态 。 

此 外 ,在 系统 故障 发 生 时 ,有 些 已 完成 事务 提交 的 结果 可 能 还 有 部 分 驻 留 在 内 存 工作 
区 ,尚未 写 人 数据 库 中 ,也 会 造成 数据 库 不 一 致 。 因 此 ,在 恢复 系统 时 ,为 保证 已 提交 事务 对 
数据 库 的 影响 永久 保持 ,应 让 已 提交 事务 重新 执行 一 遍 , 即 进行 REDO 处 理 。 

所 以 ,发 生 系统 故障 ,系统 重新 启动 之 后 ,DBMS 除 需要 撤销 所 有 未 完成 事务 外 ,还 需 
要 对 所 有 已 提交 的 事务 重 做 ,使 数据 库 真 正 恢复 到 一 致 状态 。 

3. 介质 故障 

介质 故障 ,又 称 硬 故 障 , 是 指 在 数据 库 系 统 运行 过 程 中 , 因 磁 盘 损坏 、 磁 头 碰撞 、 强 磁场 
F 扰 以 及 其 他 天 灾 人 祸 等 导致 数据 库 的 数据 部 分 或 者 全 部 丢失 的 一 类 故障 。 

在 介质 故障 中 数据 库 会 遭受 破坏 ,虽然 故障 发 生 的 可 能 性 比 前 两 类 小 ,但 破坏 性 最 大 ， 
属于 灾难 性 故障 。 处 理 这 类 故障 的 主要 技术 是 数据 库 备 份 ,周期 性 地 将 全 部 数据 库 和 记录 
事务 操作 执行 过 程 的 日 志 备份 在 廉价 存储 介质 上 ,形成 后 备 副 本 , 当 系 统 遇 到 此 类 故障 时 可 
以 加 载 最 近 的 后 备 副本 , 重 做 最 近 后 备 副 本 之 后 提交 的 所 有 事务 。 

4. 计算 机 病毒 

计算 机 病毒 ,是 一 组 能 够 自我 复制 传播 的 计算 机 指令 或 者 程序 代码 ,它们 能 够 破坏 计算 
机 功能 或 者 破坏 数据 ,影响 计算 机 包括 数据 库 系统 的 使 用 。 

在 互联 网 时 代 , 计 算 机 病毒 已 经 成 为 计算 机 系统 的 主要 威胁 ,为 此 计算 机 安全 工作 者 研 
制 了 许多 预防 病毒 的 “疫苗 ”, 检 查 诊断、 消灭 计算 机 病毒 的 软件 也 在 不 断 发 展 。 但 是 ,迄今 
为 止 还 没有 一 种 “疫苗 ?能 够 使 计算 机 系统 终生 免疫 。 因 此 ,数据 库 系统 及 数据 库 文件 不 可 
避免 会 遭受 计算 机 病毒 侵袭 ,一 旦 破坏 仍然 需要 用 恢复 技术 加 以 恢复 。 


6.2.2 数据 库 恢复 的 实现 技术 


数据 库 恢复 技术 的 基本 原理 是 建立 “元 余 ”, 即 在 数据 库 正常 运行 时 重复 存储 一 些 数据 
和 信息 ,保证 有 足够 的 信息 用 于 故障 恢复 ; 当 故 障 发 生 后 ,数据 库 中 任何 一 部 分 被 破坏 的 或 
不 正确 的 数据 可 以 根据 存储 在 系统 别处 的 元 余数 据 来 重建 。 最 常用 的 宛 余数 据 有 后 备 副本 
和 日 志文 件 。 尽 管 恢复 的 基本 原理 简单 ,但 实现 的 细节 却 相当 复杂 。 

因此 ,数据 库 恢复 技术 涉及 的 两 个 关键 问题 是 : 第 一 ,如 何 建立 元 余数 据 ; 第 二 ,如 何 
利用 这 些 宛 余 数据 实施 数据 库 恢 复 。 

通常 在 一 个 数据 库 系统 中 利用 数据 转 储 (Dump) 和 日 志文 件 (Logging) 两 种 方法 来 建 
立 宛 余数 据 。 

1. 通过 数据 转 储 建立 元 余 

数据 转 储 就 是 由 DBA (数据 库 管 理 员 ) 定 期 地 将 整个 数据 库 复 制 到 磁带 或 男 一 个 磁盘 
上 的 过 程 , 转 储 到 磁带 或 另 一 个 磁盘 上 的 数据 库 副 本 称 为 后 备 副 本 或 后 援 副本 。 

当 数 据 库 发 生 故 障 时 ,就 可 以 将 最 近 的 后 备 副本 重新 装 和 ,把 数据 库 恢 复 起 来 。 显 然 ， 
此 时 数据 库 只 能 恢复 到 最 近 转 储 时 的 状态 ,从 最 近 转 储 点 至 故障 期 间 所 有 数据 库 的 更 新 将 
会 丢失 ,需要 重新 运行 这 期 间 的 全 部 更 新 事务 才能 完全 恢复 ,如 图 6-1 所 示 。 
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运行 事务 
转 储 > 
最 近 转 储 点 。 重新 运行 事务 。 故障 发 生 点 
恢复 - 
装 入 后 备 副本 
图 6-1 转 储 和 恢复 


转 储 又 可 以 分 为 静态 转 储 和 动态 转 储 。 静 态 转 储 是 在 系统 中 没有 事务 运行 的 时 候 进 行 
的 转 储 操作 。 即 转 储 操作 开始 的 时 候 , 数 据 库 处 于 一 致 性 状态 ,而 且 转 储 期 间 数 据 库 必须 保 
持 该 一 致 状态 , 转 储 过 程 中 不 允许 (或 不 存在 ) 对 数据 库 的 任何 存 取 和 更 新 操作 。 苦 态 转 储 
简单 ,但 转 储 必须 等 待 正 运行 的 用 户 事务 结束 才能 进行 ,同样 ,新 的 事务 必须 等 待 转 储 结束 
才能 执行 。 显然 ,静态 转 储 能 保证 副本 与 数据 库 的 一 致 性 ,但 是 转 储 效率 较 低 。 

由 于 数据 库 的 数据 量 一 般 比 较 大 ,静态 转 储 一 次 形成 后 备 副 本 很 费时 间 , 并 且 转 储 期 间 
不 允许 对 数据 库 的 操作 , 故 建立 后 备 副 本 不 能 太 频 繁 , 应 根据 数据 库 的 使 用 情况 确定 一 
当 的 转 储 周期 ,例如 可 以 在 周末 或 夜间 进行 。 

动态 转 储 是 指 转 储 期 间 允 许 对 数据 库 进 行 存 取 或 更 新 , 即 转 储 和 用 户 事务 可 以 并 发 执 
行 。 动 态 转 储 克服 了 静态 转 储 的 缺点 ,效率 较 高 ,但 它 不 能 保证 副本 和 数据 库 的 一 致 性 。 为 
此 必须 把 转 储 期 间 各 事务 对 数据 库 的 更 新 活动 登记 下 来 ,建立 日 志文 件 ,后 援 副本 加 上 日 志 
文件 一 起 才能 把 数据 库 恢 复 到 转 储 结束 时 刻 的 一 致 性 状态 。 

另外 , 转 储 又 可 以 分 为 海量 转 储 和 增 量 转 储 方式 。 转 储 周 期 愈 长 ,发 生 故障 丢失 的 数据 
的 概率 也 愈 多 。 如 果 只 转 储 更 新 过 的 数据 的 概率 , 则 转 储 的 数据 量 显著 减少 , 转 储 消耗 的 时 
间 减 少 , 转 储 周期 可 以 缩短 ,从 而 可 以 减少 丢失 的 数据 ,这 种 转 储 称 为 增 量 转 储 。 转 储 全 部 
数据 库 内容 称 为 海量 转 储 。 一 般 情 况 下 ,需要 将 海量 转 储 和 增 量 转 储 结合 起 来 使 用 ,例如 ， 
每 周 进行 一 次 海量 转 储 , 每 天 晚上 进行 一 次 增 量 转 储 。 

数据 的 增 量 转 储 和 海量 转 储 也 分 别 可 以 在 动态 和 静态 两 种 状态 下 进行 ,因此 数据 转 储 
的 方法 可 以 分 为 4 类 : 动态 海量 转 储 , 动 态 增 量 转 储 , 静 态 海量 转 储 和 静态 增 量 转 储 。 

2. 通过 日 志文 件 建立 元 余 

日 志文 件 是 用 来 记录 事务 对 数据 库 所 做 的 每 一 次 更 新 活动 的 文件 。 每 一 次 更 新 活动 的 
内 容 作 为 一 条 日 志 记 录 , 写 入 日 志文 件 ,也 称 为 登记 日 志 。 一 条 日 志 记 录 的 主要 内 容 包 括 : 
事务 标识 ,操作 类 型 .对 象 标 识 .前 像 、 后 像 。 一 般 格式 如 下 : 


事务 标识 | 操作 类 型 | 对 象 标识 | 前 像 | 后 像 


事务 标识 用 于 唯一 地 标识 执行 更 新 操作 的 事务 ,操作 类 型 有 start、commit、rollback、 
update、insert、delete, 对 象 标识 用 于 唯一 地 标识 更 新 操作 所 针对 的 数据 对 象 ,前 像 是 数据 对 
象 在 更 新 操作 执行 之 前 的 旧 值 ,后 像 是 数据 对 象 在 更 新 操作 执行 之 后 的 新 值 。 

在 事务 执行 过 程 中 ,如 果 发 生 如 下 事件 或 者 操作 ,就 在 日 志文 件 中 写 一 个 日 志 记 录 。 

(1) 事务 工 开 始 , 日 志 记 录 为 (T,start,，,) 

(2) 事务 T 修改 对 象 A, 日 志 :记录 为 ( 工 ， update,A ,前 像 ,后 像 ) 

(3) 事务 工 插 和 对象 A, 日 志 记 录 为 (T,insert,A,, 后 像 ) 

(4) 事务 工 删除 对 象 A ,日志 记录 为 CT,delete,A, 前 像 ,) 


山 


(5) 事务 T 提交 ,日 志 记录 为 C(T,commit,,,) 

(6) 事务 T 回 滚 ,日 志 记录 为 CT,rollback,,,) 

为 保证 数据 库 恢 复 的 正确 性 ,登记 日 志 时 必须 遵循 如 下 两 条 原则 。 

(1) 登记 的 次 序 必须 严格 按照 并 发 事务 执行 的 时 间 次 序 ; 

(2) 必须 先 写 日 志文 件 , 然 后 写 数据 库 , 并 且 日 志文 件 不 能 和 数据 库 放 在 同一 物理 磁盘 
上 ,要 经 常 把 日 志文 件 复制 到 其 他 稳定 存储 设备 上 。 

利用 日 志文 件 可 以 执行 UNDO 操作 , 即 撤销 或 回 滚 未 完成 的 事务 对 数据 库 所 造成 的 改 
变 ; 还 可 以 执行 REDO 操作 , 即 让 已 提交 事务 重新 执行 一 遍 , 保 证 已 提交 事务 对 数据 库 的 
影响 在 外 部 存储 中 永久 保持 。 

日 志文 件 在 故障 恢复 时 非常 重要 。 事 务 故障 和 系统 故障 恢复 时 必须 使 用 日 志文 件 ; 介 
质 故 障 恢复 需要 结合 后 备 副 本 和 日 志文 件 ,才能 够 将 数据 库 恢复 到 故障 发 生前 的 某 个 一 致 
状态 ; 在 动态 转 储 方式 中 必须 建立 日 志文 件 ,动态 转 储 的 后 备 副本 只 有 结合 日 志文 件 才能 
将 数据 库 恢 复 到 转 储 结束 时 的 一 致 状态 。 

3. 故障 恢复 

利用 数据 转 储 和 日 志文 件 建立 宛 余 信 息 ,在 故障 发 生 之 后 就 可 以 利用 这 些 宛 余 信 息 实 
施 数据 库 恢 复 。 根 据 数据 库 系 统 的 故障 类 型 ,恢复 需要 采用 不 同 的 策略 。 

1) 事务 内 部 故障 的 恢复 

事务 内 部 故障 ,必定 发 生 在 当前 事务 提交 之 前 ,这 时 应 撤销 CUNDO) 该 事务 对 数据 库 
的 一 切 更 新 影响 ,由 DBMS 自动 完成 ,对 用 户 透 明 。 采 取 的 步骤 如 下 。 

(1) 反 向 扫描 日 志文 件 ,查找 该 事务 的 更 新 操作 。 

(2) 若 查 到 是 更 新 操作 , 则 将 日 志文 件 “ 前 像 * 写 和 数据库; 若是 插入 操作 , 则 将 数据 对 
象 删 去 ; 若是 删除 操作 , 则 做 插入 操作 ,插入 数据 对 象 的 值 为 日 志 记 录 中 的 “前 像 ”。 

(3) 继续 反 向 扫描 日 志文 件 , 找 出 其 他 的 更 新 操作 ,并 做 同样 的 处 理 ,直至 找到 该 事务 
的 start 标记 为 止 。 

2) 系统 故障 的 恢复 

系统 故障 会 使 主 存 中 的 数据 丢失 ,此 时 已 提交 事务 对 数据 库 的 更 新 可 能 还 驻 留 在 内 存 
工作 区 而 未 写 入 数据 库 ,为 保证 已 提交 事务 的 更 新 不 会 丢失 ,需要 重 做 (REDO) 已 提交 事 
务 ; 此 外 ,对 未 提交 的 事务 还 必须 撤销 所 有 对 数据 库 的 更 新 。 

系统 故障 恢复 在 系统 重新 启动 时 由 DBMS 自动 完成 ,无 须 用 户 干预 。 步 骤 如 下 。 

(1) 从 头 扫 描 日 志文 件 , 找 出 在 故障 发 生前 已 提交 的 事务 ( 即 有 start 记录 和 commit 记 
录 的 事务 ) ,将 其 记 入 重 做 (REDO) 队 列 。 同 时 找 出 尚未 完成 的 事务 ( 即 只 有 start 记录 ,而 
没有 commit 或 rollback 记录 的 事务 ) ,将 其 记 入 撤销 (UNDO) 队 列 。 

(2) 对 REDO 队列 中 每 个 事务 进行 REDO 操作 ,. 即 正 向 扫描 日 志文 件 , 依 据 登 入 日 志 
文件 中 日 志 记 录 次 序 , 重 新 执行 登记 的 操作 。 
(3) 对 UNDO 队列 中 每 个 事务 进行 UNDO 操作 , 即 反 向 扫描 日 志文 件 ,依据 登入 日 志 
文件 中 相反 次 序 ,对 每 个 更 新 操作 执行 逆 操 作 。 即 对 已 经 插入 的 新 记录 执行 删除 操作 ,对 已 
经 删除 的 记录 重新 插入 ,对 修改 的 数据 恢复 前 像 (用 旧 值 代 替 新 值 ) 。 

实际 上 ,REDO 队列 中 大 部 分 事务 的 更 新 影响 都 已 经 写 人 数据 库 , 只 有 少数 事务 的 更 
新 未 写 和 数据库 而 需要 重 做 。 如 果 不 加 区 分 地 重 做 全 部 事务 ,那么 对 于 很 大 的 日 志文 件 而 
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言 ,恢复 过 程 会 导致 系统 长 时 间 宕 机 。 为 此 ,引入 检查 点 (CheckPoint) 技 术 ,可 减少 系统 故 
障 恢复 时 扫描 日 志 记 录 的 数目 以 及 重 做 已 提交 事务 的 工作 量 。 

检查 点 ,是 数据 库 的 一 个 内 部 事件 ,在 系统 运行 过 程 中 ,DBMS 按 一 定 的 间隔 在 日 志文 
件 中 设置 一 个 检查 点 。 设 置 检查 点 时 需要 执行 下 列 动作 。 

(1) 暂停 事务 的 执行 ,在 日 志文 件 中 写 一 条 检查 点 开始 记录 : START_CKPT<T， 
Ts，… ,TT, >, 其 中 ,T; 表示 当前 正在 进行 还 没有 commit 的 事务 。 

(2) 将 上 一 个 检查 点 之 后 已 提交 的 事务 留 在 内 存 工作 区 ,所 有 更 新 的 数据 写 人 数据库 
( 即 磁盘 上 ) ,使 数据 库 进入 一 个 一 致 的 状态 。 

(3) 在 日 志文 件 中 写 入 一 个 检查 点 结束 记录 : END_CKPT。 

采用 检查 点 技术 ,在 系统 故障 恢复 时 , 记 入 重 做 队列 的 事务 ,只 是 从 最 近 一 个 检查 点 之 
后 到 发 生 故 障 时 已 提交 的 事务 ,这 样 可 以 大 大 减少 事务 重 做 的 工作 量 。 

3) 介质 故障 的 恢复 

发 生 介质 故障 后 ,磁盘 及 磁盘 上 的 数据 均 可 能 被 破坏 。 这 时 ,恢复 的 方法 是 重 装 数据 
库 , 然 后 重 做 已 经 完成 的 事务 。 具 体 措 施 如 下 。 

(1) 必要 时 更 换 磁 盘 , 修 复 系统 (包括 操作 系统 和 DBMS) ,重新 启动 系统 。 

(2) 装 和 最近 的 数据 库 后备 副 本 ,使 数据 库 恢 复 到 最 近 一 次 转 储 时 的 可 用 状态 。 

(3) 装 入 日 志文 件 副本 ,根据 日 志文 件 重 做 最 近 一 次 转 储 之 后 提交 的 所 有 事务 。 

经 过 上 述 步骤 ,数据 库 就 恢复 到 了 故障 前 的 一 致 性 状态 。 


6.3 并 发 控制 


作为 共享 资源 的 数据 库 , 可 以 同时 供 很 多 用 户 使 用 。 在 这 样 的 系统 中 ,同一 时 刻 需要 运 
行 很 多 个 事务 ,如 何 高 效 一 致 地 执行 这 些 事务 是 并 发 控制 的 工作 。 

如 果 多 个 事务 依次 顺序 执行 ,一 个 事务 完全 结束 后 , 另 一 个 再 开始 执行 ,这 种 执行 方式 
称 为 串 行 执行 。 显 然 ,事务 串 行 执行 ,可 以 保证 数据 库 的 一 致 性 。 

然而 ,不 同 的 事务 要 完成 的 任务 各 不 相同 。 在 同一 时 间 , 有 的 事务 需要 执行 计算 ,有 的 
事务 需要 进行 输入 /输出 ,有 的 则 需要 通信 ,如 果 是 串 行 执行 , 则 很 多 系统 资源 会 闲置 浪费 ， 
且 系统 响应 事务 的 性 能 低下 。 为 了 充分 利用 系统 资源 ,又 能 改善 对 事务 的 响应 时 间 ,应 该 允 
许多 个 事务 在 时 间 上 交叉 执行 ,并 发 地 存 取 数 据 库 ,这 种 执行 方式 称 为 并 发 存 取 。 

当 允 许多 个 事务 并 发 存 取 数据 库 时 ,如 果 不 加 以 控制 就 有 可 能 导致 并 发 事务 相互 干扰 ， 
存 取 到 不 正确 的 数据 ,破坏 数据 库 的 一 致 性 。 为 此 ,DBMS 必须 提供 并 发 控制 机 制 , 保 证 
务 的 隔离 性 。 并 发 控制 机 制 是 衡量 一 个 数据 库 管理 系统 性 能 的 重要 标志 之 一 。 


6.3.1 并 发 操作 引发 的 问题 


在 并 发 存 取 环境 下 ,如 果 不 同 事务 的 两 个 操作 均 针 对 同一 数据 对 象 , 且 至 少 有 一 个 是 写 
操作 , 则 称 这 两 个 操作 是 冲突 的 。 例 如 ,有 两 个 事务 T 和 Ta ,Ts 读 取 由 Ti 先前 已 写 的 数 
据 对 象 , 则 为 写 - 读 冲 突 (Write-Read Conflict) ,类 似 地 ,还 有 读 - 写 冲突 (Read-Write Conflict) 和 
写 - 写 冲 突 (Write-Write Conflict) 。 

车 对 并 发 事务 中 的 冲突 操作 不 加 控制 ,可 能 会 引发 三 类 问题 ; 丢失 修改 ,不 可 重复 读 ， 
读 “ 脏 ”数据 。 


1. 丢失 修改 

当 两 个 事务 T 和 Ts 先后 对 同一 数据 对 象 A 进行 修改 
并 写 入 数据 库 时 ,后 写 人 的 结果 会 覆盖 掉 先 写 入 的 结果 , 导 
致 先 写 入 的 事务 修改 结果 丢失 了 , 即 丢失 修改 问题 。 例 如 ， 
在 图 6-2 中 ,事务 T 和 T: 分 别 对 数据 对 象 A 执行 读 操作 
read(A) 和 写 操作 write(A)。 假 设 A 的 初始 值 为 5, 且 按 图 
中 的 次 序 并 发 执行 ,A 终 值 将 为 12, 因 为 T, 提交 的 结果 覆盖 
了 Ti 对 A 的 修改 ,从 而 使 Ti 对 A 的 修改 丢失 了 了。 可见, 并 
发 执行 结果 与 Ti 、T, 串 行 执行 的 结果 不 一 样 。 若 按 Ti 一 T: 
次 序 执行 , 则 A 的 终 值 为 10; 若 按 T, 一 T 次 序 执行 , 则 A 
的 终 值 为 11。 丢 失修 改 问 题 是 由 写 一 写 冲 突 引起 的 。 

2. 不 可 重复 读 

一 个 事务 如 果 没有 执行 任何 更 新 数据 库 数据 的 操作 , 则 
同一 个 查询 操作 执行 两 次 或 多 次 ,结果 应 该 是 一 致 的 ; 如 果 
不 一 致 ,就 说 明 产 生 了 不 可 重复 读 的 现象 。 

如 图 6-3 所 示 ,事务 Ti 两 次 读 人 数据 A, 在 两 次 读 之 间 ， 


Wi 和 
read(A) 
read(A) 
A:=A-l 
write(A) 
A:=2*+A+2 
write(A) 


6-2 丢失 修改 


Ti 对 人 未 做 修改 , 照 理 说 Ti 两 次 读 出 的 A 应 是 一 样 的 ,但 是 另 一 事务 T; ,在 Ti 两 次 读 出 
A 之 间 , 对 A 进行 修改 ,以 致 T) 两 次 读 出 A 不 同 , 即 读 不 一 致 现象 。 此 外 ,如 果 Ti 读 出 的 
是 满足 特定 条 件 的 一 个 元 组 集合 A, 接 着 T, 删除 或 插入 了 满足 该 条 件 的 一 些 元 组 ,于 是 在 
Ti 再 次 执行 同样 一 个 查询 时 ,发 现 读 取 的 元 组 变 少 或 变 多 了 , 即 导致 了 幻影 读 现象 。 

读 不 一 致 和 幻影 读 是 两 种 不 可 重复 读 现象 , 均 是 由 读 - 写 冲突 引起 的 。 


3. 读 “* 脏 ?数据 


读 “ 脏 ”数据 ,简称 脏 读 ,是 指 一 个 事务 读 取 了 另 一 个 未 提交 的 事务 中 的 数据 。 在 图 6-4 
中 ,假设 事务 T, 读 入 数据 A 二 6, 然 后 做 加 1 修改 A=7, 写 入 数据 库 , 此 时 事务 Ts 读 入 数据 
A 二 7。 假 设 因 某 种 原因 事务 Ti 中 途 天 折 , 对 A 的 修改 通过 rollback 撤销 ,于 是 A 又 恢复 
成 原 值 6, 这 样 T, 读 到 的 就 是 不 正确 的 数据 。 这 种 不 正确 (或 不 一 致 ) 的 数据 , 称 为 “ 脏 ” 数 


据 。 脏 读 问 题 是 由 写 - 读 冲突 引起 的 。 


Ti Ts 
执 | read(A) 
行 
A:=A+l 
次 
执行 | read(A) 序 | write(A) 
次 序 n 
write(A) read(A) 
J 
read(A) rollback 第 
6 
图 6-3 不 可 重复 读 图 6-4 读 “ 脏 ”数据 章 
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并 发 事务 之 间 的 冲突 操作 破坏 了 事务 的 隔离 性 ,造成 数据 不 一 致 ,进而 破坏 事务 的 一 臻 
性 。 并 发 控制 的 任务 就 是 要 通过 合理 的 调度 方式 来 控制 并 发 事务 的 执行 次 序 , 使 得 多 个 事 
务 之 间 互 不 干扰 ,从 而 避免 造成 数据 库 中 的 数据 不 一 致 。 


6.3.2 调度 及 其 可 串 行 化 


在 并 发 访问 情况 下 , 当 有 多 个 事务 并 发 执行 时 ,其 操作 交叉 执行 的 次 序 有 很 多 种 可 能 ， 
而 不 同 的 交叉 执行 次 序 通常 会 得 到 不 同 的 结果 。 因 此 ,必须 要 有 衡量 一 个 并 发 调度 正确 与 
否 的 判断 准则 。 

已 知 个 事务 Ti ,T;,…,T,, 则 这 个 事务 的 一 个 调度 S 是 个 事务 中 所 有 操作 的 一 
个 执行 次 序 且 该 次 序 满足 这 样 的 约束 : 对 于 任意 事务 Ti 而 言 , 其 操作 的 先后 顺序 在 调度 S 
中 得 到 保持 。 注 意 ,来自 其 他 事务 Ti 的 操作 可 以 同 T; 的 操作 交错 执行 。 

如 果 在 一 个 调度 中 ,各 个 事务 没有 交叉 执行 ,而 是 串 行 执 行 , 则 该 调度 称 为 串 行 调度 。 
由 于 串 行 调度 中 ,一 个 事务 运行 过 程 中 没有 其 他 事务 同时 运行 , 它 不 会 受到 其 他 事务 的 干 
扰 ,所 以 , 串 行 调度 的 结果 总 是 正确 的 。 虽 然 以 不 同 的 次 序 串 行 执行 事务 的 串 行 调度 可 能 会 
产生 不 同 的 结果 ,但 它们 都 能 够 保持 数据 库 的 一 致 性 ,所 以 都 认为 是 正确 的 。 

如 果 在 一 个 调度 中 各 个 事务 交叉 地 执行 ,这 个 调度 称 为 并 发 调度 。 

对 同一 事务 集 , 可 能 有 很 多 种 调度 ,如 果 其 中 两 个 调度 S 和 S ,在 数据 库 任 何 状 态 下 ， 
对 于 相同 的 初始 状态 ,其 执行 结果 都 是 一 样 的 , 则 称 S 和 Ss 是 等 价 的 。 

当 一 个 事务 集 的 并 发 调度 与 它 的 某 一 串 行 调度 是 等 价 的 , 则 称 该 并 发 调度 是 可 串 行 化 
的 (CSerializable) 。 显 然 ,可 串 行 化 调度 的 结果 保持 数据 库 的 一 致 性 ,也 是 正确 的 。 所 以 ,在 
一 般 的 DBMS 中 ,都 是 以 可 串 行 化 作为 并 发 调度 正确 与 否 的 判定 准则 。 

例如 ,在 图 6-5 中 给 出 两 个 事务 T 和 T: (假设 初始 值 A=10,B=10) 及 其 4 种 调度 方 
案 。 其 中 ,图 6-5(a) 和 图 6-5(b) 是 两 个 串 行 调度 ,执行 结果 均 为 : A 二 5,B 二 10; 而 图 6-5(c) 
和 图 6-5(d) 是 两 个 可 能 的 并 发 调度 ,其 中 ,图 6-5(c) 的 执行 结果 A=5,B=10, 是 可 串 行 化 
调度 ,而 图 6-5(d) 的 执行 结果 A=5,B=15, 不 等 价 于 任何 一 个 串 行 调度 ,是 一 个 不 可 串 行 
化 调度 。 


Ti: | READ (A) T»: | READ (B) 
A=A-5 BeB=s 
WRITE (A) WRITE (B) 
READ (B) 

Be=B+5 
WRITE (B) 


图 6-5 事务 Ti Ts 及 其 4 种 调度 方案 


执 


入 到 到 和 
READ (A) READ (B) 
A=A-5 B=B-5 
WRITE (A) WRITE (B) 
执 
READ (B) 行 READ (A) 
B:=B+5 次 | A:=A-5 
序 
WRITE (B) WRITE (A) 
! 
READ (B) READ (B) 
B:=B-5 B=B+5 
WRITE (B) WRITE (B) 
(a) 串 行 调度 1 (b) 串 行 调度 2 
Ti T: Ti T 
READ (A) READ (A) 
READ (B) A:=A-5 
A=A-5 READ (B) 
执 
B:=B-5 行 WRITE (A) 
WRITE (A) 次 B=B-5 
序 
WRITE (B) READ (B) 
! 
READ (B) WRITE (B) 
B=B+5 B:=B+5 
WRITE (B) WRITE (B) 
(c) 可 串 行 化 调度 (d) 不 可 串 行 化 调度 
图 6-5 ( 续 ) 
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可 以 用 前 趋 图 (Precedence Graph) 来 判断 一 个 调度 S 是 否 可 串 行 化 。 前 趋 图 是 一 个 有 
向 图 G=(V,，E)。 其 中 ,V 是 由 所 有 参加 调度 的 事务 构成 的 节点 集 。 弧 集 玉 可 以 通过 分 析 
冲突 操作 来 决定 。 如 果 下 列 条 件 之 一 成 立 , 则 向 集合 E 中 加 入 一 条 弧 Ti 一 Ti: 

(1) 事务 T; 读 x 在 事务 Ti 写 x 之 前 ; 

(2) 事务 T; 写 x 在 事务 Ti 读 x 之 前 ; 

(3) 事务 T, 写 x 在 事务 Ti 写 x 之 前 。 

如 此 便 可 构成 一 个 并 发 调度 的 前 趋 图 。 如 果 在 前 趋 图 中 存在 回路 , 则 S 不 可 能 等 价 于 
任何 串 行 调度 ; 如果 无 回路 , 则 可 通过 拓扑 排序 获得 S 的 等 价 的 串 行 调度 。 

拓扑 排序 方法 如 下 : 由 于 图 中 无 回路 , 则 必 有 一 个 节点 无 人 弧 ,将 这 个 节点 及 其 相连 的 
弧 删 去 ,并 把 该 节点 存 人 先进 先 出 的 队列 中 。 对 所 剩 的 图 做 同样 的 处 理 , 直 至 所 有 节点 移 人 
队列 中 。 按 队列 中 的 次 序 串 行 安排 各 事务 的 执行 , 即 得 到 等 价 的 串 行 调 度 。 

例如 ,图 6-6(a) 为 4 个 事务 Ti ,T: ,Ts,T 的 一 个 并 发 调度 S, 图 6-6(b) 为 调度 S 的 前 
趋 图 ,图 6-6(c) 为 与 调度 S 等 价 的 串 行 调度 。 


Ti [| PP | TT | T 
write(y) 
read(x) 
read(y) 灾 
write(x) 
write(x) T» Ts 
write(z) 
read(z) 
write(x) Ts 
(a) 一 个 并 发 调度 S (b) S 的 前 趋 图 
1 Ta T Ta 
© ~O ~O ~O 
(ce) S 等 价 的 品行 调度 


图 6-6 并 发 调度 的 前 趋 图 和 等 价 的 串 行 调度 


6.3.3 事务 的 隔离 性 级 别 


事务 在 并 发 执行 时 应 该 相互 独立 互 不 干扰 , 即 事务 的 隔离 性 。 但 是 ,实践 中 要 实现 完全 
的 事务 隔离 ,往往 会 导致 系统 的 事务 并 发 能 力 显著 下 降 。 因 此 ,在 一 些 数据 库 应 用 中 有 时 候 
会 放松 对 隔离 性 的 要 求 , 通 过 “隔离 性 级 别 " 来 权衡 事务 的 隔离 性 和 并 发 能 力 。 
事务 的 隔离 性 级 别 , 又 称 为 事务 的 一 致 性 级 别 ,是 一 个 事务 必须 与 其 他 事务 实现 隔离 的 
程度 ,是 事务 可 接受 的 数据 不 一 致 程度 。 较 低 的 隔离 级 别 可 以 增加 并 发 ,但 代价 是 降低 数据 
的 正确 性 。 相 反 , 较 高 的 隔离 级 别 可 以 确保 数据 的 正确 性 ,但 会 影响 事务 并 发 度 。 

SQL 92 标准 定义 了 4 种 标准 隔离 级 别 , 从 低 到 高 依次 为 : 读 未 提交 (Read Uncommitted)、 
读 已 提交 (Read Committed) ,可 重复 读 (Repeatable Read) .可 串 行 化 (Serializable) 。 

(1) 读 未 提交 : 最 低 的 隔离 级 别 ,在 这 种 事务 隔离 级 别 下 ,一 个 事务 可 以 读 到 另外 一 个 
事务 未 提交 的 数据 ,不 允许 丢失 修改 ,接受 读 脏 数 据 和 不 可 重复 读 现象 。 

(2) 读 已 提交 : 若 事 务 还 没 提交 ,其 他 事务 不 能 读 取 该 事务 正在 修改 的 数据 。 不 允许 


丢失 修改 和 读 脏 数据 ,接受 不 可 重复 读 现象 。 

(3) 可 重复 读 : 事务 多 次 读 取 同一 数据 对 象 的 结果 一 致 。 不 允许 丢失 修改 、 读 脏 数据 
和 读 不 一 致 ,接受 幻影 读 现象 。 

(4) 可 串 行 化 : 最 高 级 别 的 隔离 性 ,保证 可 串 行 化 ,不 允许 丢失 修改 、 读 脏 数 据 、 读 不 一 
致 以 及 幻影 读 现象 的 发 生 。 

上 述 4 种 事务 隔离 级 别 在 隔离 程度 上 越 来 越 高 ,数据 的 一 致 性 保证 越 来 越 强 ,但 在 并 发 
能 力 上 也 越 来 越 低 。 在 实践 中 可 以 根据 业务 需要 选择 合适 的 隔离 级 别 。 

为 了 实现 并 发 调度 的 隔离 性 ,目前 DBMS 普遍 采取 封锁 技术 。 除 此 之 外 ,还 有 其 他 一 
些 方法 ,如 时 间 戳 技术 .乐观 控制 法 等 。 


6.3.4 封锁 技术 


封锁 是 实现 并 发 控制 的 一 种 机 制 。 所 谓 封锁 就 是 事务 T 在 对 某 个 数据 对 象 操作 之 前 ， 
先 对 其 加 锁 , 加 锁 后 事务 工 就 对 该 数据 对 象 有 一 定 程度 的 独占 控制 ,在 事务 T 释放 锁 之 前 ， 
其 他 事务 在 操作 该 数据 对 象 时 会 受到 这 种 独占 控制 的 影响 。 

DBMS 通常 提供 多 种 类 型 的 封锁 。 一 个 事务 对 数据 对 象 加 锁 后 究竟 拥有 何 种 程度 的 
独占 控制 是 由 封锁 类 型 决定 的 。 最 基本 的 封锁 类 型 有 排他 锁 和 共享 锁 两 种 。 

1. 排他 锁 

排他 锁 (eXclusive Locks) ,也 称 为 X 锁 或 者 写 锁 。 若 事务 对 数据 对 象 A 加 上 XX 锁 ， 
则 在 加 锁 期 间 只 允许 工 对 数据 对 象 A 进行 读 取 和 修改 ,不 允许 任何 其 他 事务 再 对 数据 对 象 
A 加 任何 类 型 的 锁 , 直 至 工 释 放 掉 A 上 的 锁 。 

2. 共享 锁 

共享 锁 (Sharing Locks) ,也 称 为 S 锁 或 者 读 锁 。 若 事务 对 数据 对 象 A 加 上 S 锁 , 则 
事务 工 可 以 读 A 但 不 能 修改 A, 其 他 事务 只 能 再 对 A 加 S 锁 , 而 不 能 加 X 锁 , 直 到 工 释 放 
A 上 的 S 锁 。 这 就 保证 了 其 他 事务 可 以 读 A, 但 在 工 释放 A 上 的 S 锁 之 前 不 能 对 A 做 任 
何 修改 。 同 一 数据 对 象 允许 多 个 事务 并 发 地 读 ,但 对 写 操 作 是 排他 的 。 

排他 锁 与 共享 锁 的 封锁 控制 方式 可 以 用 如 表 6-1 所 示 的 相 容 矩阵 来 表示 。 

表 6-1 基本 锁 的 相 容 矩 阵 


T 
X S 
T, 
X N N 
S N 至 
NL 等 


在 表 6-1, 最 左边 一 列 是 事务 T 对 某 数据 对 象 的 加 锁 情 况 ,X 表示 已 加 X 锁 ,S 表示 已 
加 S 锁 .NL 表示 无 锁 ; 最 上 面 一 行 是 事务 T, 对 同一 数据 对 象 发 出 的 加 锁 请 求 。T, 的 加 锁 
请 求 能 否 被 满足 ,用 和 矩阵 中 的 Y 和 N 表示 ,Y 表示 与 Ti 已 持 有 的 锁 相 容 ,T 的 加 锁 请 求 可 
以 满足 ; N 表示 与 Ti 已 持 有 的 锁 冲 突 ,T, 的 加 锁 请 求 被 拒绝 。 
3. 封锁 协议 
在 运用 X 锁 和 S 锁 对 数据 对 象 加 锁 时 ,还 需要 约定 一 些 规则 ,例如 , 何 时 申请 X 锁 或 章 
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锁 、 持 锁 时 间 、 何 时 释放 等 ,这些 规 则 称 为 封锁 协议 (Locking Protocol) 。 对 封锁 方式 规定 不 
同 的 规则 ,就 形成 了 各 种 不 同 的 封锁 协议 。 

针对 SQL 92 定义 的 读 未 提交 、 读 已 提交 、 可 重复 读 、 可 串 行 化 4 种 事务 隔离 级 别 , 可 以 
通过 下 文 的 三 级 封锁 协议 和 两 段 锁 协议 来 实现 ,不 同 程度 地 解决 了 并 发 操作 的 不 正确 调度 
可 能 带 来 的 丢失 修改 \ 不 可 重复 读 和 读 “ 脏 ”数据 等 不 一 致 问 题 。 

1) 一 级 封锁 协议 

一 级 封锁 协议 : 事务 T 在 修改 数据 R 之 前 必须 先 对 其 加 X 锁 , 直 到 事务 结束 才 释 放 。 
事务 结束 包括 正常 结束 (COMMIT) 和 非 正常 结束 (ROLLBACK) 。 

一 级 封锁 协议 可 防止 丢失 修改 ,并 保证 事务 T 是 可 恢复 的 ,实现 读 未 提交 的 隔离 级 别 。 
例如 ,在 表 6-2(a) 中 使 用 一 级 封锁 协议 解决 了 丢失 修改 问题 。 

在 表 6-2(a) 中 ,事务 Ti 在 对 A 进行 修改 之 前 先 对 A 加 X 锁 , 当 T, 再 请 求 对 A 加 X 
锁 时 被 拒绝 ,T, 只 能 等 待 T, 释放 A 上 的 锁 后 ,T, 才能 获得 对 A 的 X 锁 , 这 时 它 读 到 的 A 
已 经 是 Ti 更 新 过 的 值 15 ,再 按 新 的 A 值 进行 运算 ,并 将 结果 值 A 二 14 送 回 到 磁盘 。 这 样 
就 避免 了 丢失 Ti 的 更 新 。 

在 一 级 封锁 协议 中 ,如果 仅 仅 是 读数 据 而 不 对 其 进行 修改 ,是 不 需要 加 锁 的 ,所 以 它 不 
能 保证 可 重复 读 和 不 会 读 到 * 脏 ?数据 。 

2) 二 级 封锁 协议 

二 级 封锁 协议 : 在 一 级 封锁 协议 基础 上 ,再 加 上 事务 T 在 读 取 数 据 R 之 前 必须 先 对 其 
加 S 锁 , 读 完 后 即 可 释放 S 锁 。 

二 级 封锁 协议 除 防止 丢失 修改 之 外 ,还 进一步 防止 了 读 “ 脏 "数据 ,实现 读 已 提交 的 隔离 
级 别 。 例 如 ,在 表 6-2(c) 中 使 用 二 级 封锁 协议 解决 了 读 “ 脏 ”数据 问题 。 

表 6-2(c) 中 ,事务 Ti 在 对 C 进行 修改 之 前 , 先 对 C 加 X 锁 ,修改 其 值 后 写 回 磁盘 。 这 
时 Ts 请 求 在 C 上 加 S 锁 , 因 T 已 在 C 上 加 了 X 锁 ,Ts 只 能 等 待 。T, 因 某 种 原因 被 撤销 ， 
C 恢复 为 原 值 100,T 释放 C 上 的 X 锁 后 Ts 获得 C 上 的 S 锁 , 读 C=100。 这 就 避免 了 TT。 
读 “ 脏 ”数据 。 

在 二 级 封锁 协议 中 ,由 于 读 完 数据 后 即 可 释放 S 锁 ,所 以 它 不 能 保证 可 重复 读 。 

3) 三 级 封锁 协议 

三 级 封锁 协议 : 在 一 级 封锁 协议 基础 上 ,再 加 上 事务 T 在 读 取 数据 R 之 前 必须 先 对 其 
加 S 锁 ,直到 事务 结束 才 释 放 。 

三 级 封锁 协议 除了 防止 丢失 修改 和 读 “ 脏 ”数据 外 ,还 进一步 防止 了 不 可 重复 读 ,实现 可 
重复 读 的 隔离 级 别 。 例 如 ,在 表 6-2(b) 中 使 用 三 级 封锁 协议 解决 了 不 可 重复 读 问题 。 

表 6-2(b) 中 ,事务 Ti 在 读 A,B 之 前 , 先 对 A,B 加 S 锁 ,这 样 其 他 事务 只 能 再 对 A,B 
加 S 锁 ,而 不 能 加 XX 锁 , 即 其 他 事务 只 能 读 A,B, 而 不 能 修改 它们 。 所 以 当 T; 为 修改 B 而 
申请 对 B 的 X 锁 时 被 拒绝 ,只 能 等 待 Ti 释放 B 上 的 锁 。T; 为 验算 再 读 A,B, 这 时 读 出 的 
B 仍 是 100, 求 和 结果 仍 为 150, 即 可 重复 读 。T 结束 才 释 放 A,B 上 的 S 锁 ,T, 才 获得 对 也 
的 X 锁 。 
注意 ,所 谓 三 级 封锁 协议 可 以 避免 不 可 重复 读 ,实际 上 指 的 是 防止 了 不 可 重复 读 问 题 中 
的 读 不 一 致 现象 ,并 不 能 解决 插入 和 删除 的 幻影 读 现象 。 

上 述 三 级 协议 的 主要 区 别 在 于 什么 操作 需要 申请 封锁 ,以 及 何 时 释放 锁 ( 即 持续 时 间 ) 。 


三 个 级 别 的 封锁 协议 可 以 总 结 为 表 6-3。 从 一 级 封锁 协议 到 三 级 封锁 协议 , 习 


级 别 逐 渐 增 加 ,数据 的 一 致 性 不 断 增强 ,但 事务 执行 的 并 发 度 却 逐 渐 降 低 。 
表 6-2 基于 封锁 机 制 解决 三 种 数据 不 一 致 问题 


有 务 的 隔离 性 


T Ts Ti T: Ti T, 
DxXlock A | Xlock A © Slock A Xlock B @ Xlock C Slock C 
@ 读 A=16 | 等 待 Slock B 等 待 读 C=100 等 待 
@ AA 一 1 | 等 待 读 A=50 等 待 CCx2 等 待 
写 回 A=15 等 待 读 B=100 等 待 写 回 C=200 等 待 
Commit 等 待 求 和 一 150 等 待 © 等 待 
Unlock A 获得 Xlock A | @ 等 待 @ ROLLBACK | 获得 Slock C 
@ 读 A=15 @ 读 A=50 等 待 〈C 恢复 为 100) | 读 C=100 
© A<—A—1 读 B =100 等 待 Unlock C Commit 

写 回 A=14 求 和 王 150 等 待 @ Unlock C 
Commit Commit 获得 Xlock B | @ 
Unlock A Unlock A 读 B=100 
Unlock B BBx2 
@® 写 回 B=200 
© Commit 
Unlock B 
(a) 没有 丢失 修改 (b) 可 重复 读 (c) 避免 读 “ 脏 ”数据 
表 6-3 三 级 封锁 协议 
X 锁 S 锁 一 致 性 保证 
操作 结束 | 事务 结束 | 操作 结束 | 事务 结束 | 不 丢失 | 不 读 “ 脏 ” 可 重复 读 
释放 释放 释放 释放 修改 数据 
一 级 封锁 协议 Vv ~ 
二 级 封锁 协议 Vv V ~ V 
三 级 封锁 协议 JV JV JV JV J 
4) 两 段 锁 协 议 


两 段 锁 协 议 (Two-Phase Locking Protocol,2PL 协议 ) ,是 一 种 能 够 实现 并 发 调度 可 串 
行 化 的 封锁 协议 。 两 段 锁 协 议 规 定 : 

(1) 在 任何 数据 对 象 进行 读 、 写 操作 之 前 ,事务 要 获得 对 数据 对 象 的 加 锁 。 

(2) 在 释放 任意 一 个 锁 之 后 ,事务 不 再 允许 获得 任何 其 他 加 锁 。 

例如 ,下 面 两 个 事务 T 和 T,。 其 中 ,T, 遵守 两 段 锁 协 议 ,T, 不 遵守 两 段 锁 协议 。 

Ti : lock(A) .lock(B) ,lock(C) ,unlock(B) .unlock(C) ,unlock(A) 

Ts: : lock(CA) ,unlock(A) ,lock(B) ,lock(CC) .unlock(C) .unlock(B) 


因为 T 在 释放 锁 A 之 后 又 对 B 和 C 加 锁 , 不 符合 两 段 锁 协议 的 第 二 条 规定 。 如 果 事 


务 所 有 的 加 锁 操 作 都 在 第 一 个 解锁 操作 之 前 ,那么 该 事务 遵守 两 段 锁 协议 。 
在 遵守 两 段 锁 协 议事 务 中 ,明显 地 可 分 为 两 个 阶段 : 第 一 阶段 是 锁 逐 步 增加 阶段 , 称 为 
扩展 阶段 或 者 成 长 阶段 ; 第 二 阶段 是 锁 逐 步 释 放 阶段 , 称 为 收缩 阶段 。 


地 
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定理 : 若 并 发 执行 的 所 有 事务 均 遵 守 两 段 锁 协 议 , 则 对 这 些 事务 的 所 有 调度 都 是 可 串 
行 化 的 。( 证 明 略 ) 

需要 说 明 ,2PL 协议 是 调度 可 串 行 化 的 充分 条 件 , 并 不 是 调度 可 串 行 化 的 必要 条 件 。 
例如 ,下 面 三 个 事务 Ti 、T: 和 Ti ,其 中 的 T: 不 遵守 两 段 锁 协议 。 

Ti : Slock(A),read(A),unlock(A) 

T,: Slock(B) ,read(B) ,unlock(B) ,Xlock(A) ,write(A),unlock(CA) 

Ts : Xlock(B) ,write(B) ,unlock(CB) 

但 如 图 6-7 所 示 的 并 发 调度 却 是 可 串 行 化 的 , 它 等 价 于 串 行 调度 Ti 一 T: 一 T;: 。 


T | 了 | 

Slock(A) Slock(B) 

read(A) read(B) 

unlock(A) unlock(B) | xlock(B) 

write(B) 

Ay unlock(B) 
write(A) 
unlock(A) 


6-7 不 遵守 2PL 协议 的 可 串 行 化 的 调度 


如 果 遵 守 2PL 的 调度 ,将 锁 释 放 都 放 在 事务 结束 , 则 可 避免 发 生 连锁 回 滚 和 不 可 重复 
读 等 问题 。 把 所 有 锁 都 放 在 事务 结束 时 释放 的 两 段 锁 协 议 称 为 严格 的 2PL 协议 (Strict 
2PL)。 大 多 数 DBMS 都 采用 严格 的 2PL。 


6.3.5 死 镇 与 活 锁 问题 


利用 封锁 技术 ,可 以 避免 并 发 操作 引起 的 各 种 问题 , 却 可 能 产生 其 他 问题 。 

1. 死 锁 

如 果 系统 中 有 两 个 或 两 个 以 上 的 事务 都 处 于 等 待 状 态 ,并且 每 个 事务 都 在 等 待 其 中 另 
一 个 事务 解除 封锁 , 它 才 能 够 继续 执行 下 去 ,结果 造成 任何 一 个 事务 都 无 法 继续 执行 ,这 种 
现象 称 为 系统 进入 了 死 锁 (Dead Lock)。 

例如 ,事务 Ti 封锁 了 数据 A, 事 务 T, 封锁 了 数据 B, 之 后 事务 T, 又 申请 封锁 数据 B， 
由 于 Ts 已 经 封锁 了 B, 所 以 Ti 等 待 T: 释放 B 上 的 锁 。 这 Ti 六 太 
时 Ts 又 申请 封锁 数据 A, 由 于 Ti 已 经 封锁 了 A, 所 以 Ts 等 。 xlockA 


lock 
待 T 释放 A 上 的 镇 因此 ,就 出 现 了 T 和 T; 互相 等 竺 的。 xo | 
局 面 ,形成 了 死 锁 ,如 图 6-8 所 示 。 条 人 
对 付 死 锁 有 两 种 方法 一 是 死 镇 预防 ; 二 是 死 锁 检 测 ， 。 等 等 和 

即 发 现 死 锁 后 解除 。 a 


在 数据 库 系统 中 死 锁 很 少 发 生 , 即 使 发 生 也 涉及 很 少 几 
个 事务 ,所 以 可 以 不 采用 死 锁 预 防 策略 , 当 检 测 发 现 死 锁 时 ,再 采用 解除 死 锁 的 策略 。 
死 锁 检测 的 方法 一 般 有 下 列 两 种 。 
1) 超时 法 
如 果 一 个 事务 的 等 待 时 间 超 过 某 个 时 限 , 则 认为 发 生死 锁 。 超 时 法 实现 容易 ,但 是 时 限 
多 长 较 难 确定 。 如 果 时 限 设 的 太 小 , 死 锁 的 误 判 会 增加 ,本 不 是 死 锁 而 是 由 于 其 他 原因 (如 


系统 负荷 太 重 ,通信 受阻 等 ) 导 致 事务 等 待 超时 而 被 误 判 为 死 锁 ; 如 果 时 限 设 得 太 大 , 则 发 
现 死 锁 的 滞后 时 间 会 过 长 。 

2) 等 待 图 法 

等 待 图 (Wait-for Graph) 是 一 个 有 向 图 G 二 (V,E), 其 中 ,顶点 集 V 是 当前 运行 的 事务 
集 {TT ,TT ,…,T,) ,如 果 T; 等 待 T;, 则 从 T; 到 T; 有 一 条 弧 。 锁 管理 器 根据 事务 加 锁 和 释 
放 锁 申请 情况 ,动态 地 维护 此 等 待 图 。 当 且 仅 当 等 待 图 中 出 现 回路 , 则 存在 死 锁 。 

发 现 死 锁 后 ,由 锁 管理 器 做 下 列 处 理 : 在 循环 等 待 事务 中 ,选择 一 个 牺牲 代价 最 小 的 事 
务 执行 回 滚 ,并 释放 它 获得 的 锁 及 其 他 资源 。 使 其 他 事务 得 以 运行 下 去 。 

2. 活 锁 

系统 可 能 使 某 个 事务 永远 处 于 等 待 状态 ,得 不 到 封锁 的 机 会 ,这 种 现象 称 为 系统 进入 了 
活 锁 (Live Lock) 。 

例如 ,事务 T, 封锁 了 数据 A, 事 务 T, 也 申请 封锁 数据 A, 于 是 T, 等 待 ,接着 Ts 也 申 
请 封锁 数据 A, 于 是 Ts .Ts 等 待 。 当 站 释放 A 上 的 锁 后 ,系统 首先 批准 了 Ts 的 请 求 ,T。 
只 能 继续 等 待 ,接着 T, 也 申请 封锁 数据 A, 于 是 Ts .T, 等 待 。 当 Ts 释放 A 上 的 锁 后 ,系统 
又 批准 了 Ti 的 请 求 ……, 这 时 Ts 有 可 能 就 永远 等 待 下 去 ,这 就 是 “ 活 锁 ” 的 形成 。 

避免 活 锁 的 简单 方法 是 采用 先 来 先 服务 的 策略 。 当 多 个 事务 请 求 封 锁 同 一 数据 对 象 
时 ,封锁 子 系统 按 请 求 封 锁 的 先后 次 序 对 这 些 事务 排队 ,该 数据 对 象 上 的 锁 一 旦 释放 ,首先 
批准 申请 队列 中 第 一 个 事务 获得 锁 。 


6.3.6 封锁 的 粒度 


在 数据 库 中 ,封锁 的 数据 对 象 可 以 是 逻辑 单元 ,例如 ,属性 、 属 性 集 、 元 组 关系、 索引 项 、 
整个 索引 、 整 个 数据 库 等 ; 也 可 以 是 物理 单元 ,例如 ,页 、 块 ,存储 区 域 等 。 封 锁 的 数据 对 象 
可 以 较 大 ,如 大 到 可 以 是 整个 数据 库 一 个 存储 区 域 一 个 关系 ; 也 可 以 很 小 ,比如 小 到 一 个 
元 组 甚至 某 个 属性 。 封 锁 数据 对 象 的 大 小 称 为 封锁 的 粒度 (Granularity) 。 

封锁 粒度 越 大 ,封锁 处 理 越 简单 ,系统 开销 也 越 小 ,但 这 样 往往 把 无 须 加 锁 的 数据 也 封 
锁 了 ,从 而 不 必要 地 排斥 了 一 些 事务 ,降低 了 系统 的 并 发 度 ; 相反 ,封锁 粒度 越 小 ,往往 需要 
加 很 多 的 锁 ,系统 开销 较 大 ,但 提高 了 系统 并 发 度 。 


6.4 数据 库 安全 性 


随 着 科学 技术 的 不 断 进 步 和 发 展 ,信息 安全 问题 变 得 越 来 越 重 要 了 。 在 数据 库 领域 中 ， 
安全 问题 也 是 一 个 非常 重要 的 课题 。 数 据 库 中 所 存放 的 信息 可 能 是 各 种 保密 资料 ,比如 国 
家 机 密 、 军 事情 报 、 人 事 档 案 、 银 行 储蓄 数据 等 ,这 些 信息 必须 加 以 保护 。 数 据 库 的 安全 性 ， 
就 是 保护 数据 库 以 防止 不 合法 的 使 用 所 造成 的 数据 泄漏 更改 或 者 破坏 。 

安全 性 问题 是 计算 机 系统 中 普遍 存在 的 一 个 问题 。 而 在 数据 库 系统 中 显得 尤为 突出 ， 
因为 数据 库 系统 中 大 量 数据 集中 存放 ,而 且 为 许多 最 终 用 户 直接 共享 。 数据库 系统 建立 在 
操作 系统 之 上 ,而 操作 系统 是 计算 机 系统 的 核心 ,因此 ,数据 库 系统 的 安全 性 与 计算 机 系统 
的 安全 性 息息相关 。 

计算 机 系统 的 安全 性 问题 涉及 很 多 领域 ,比如 网 络 、 服 务 器 、 用 户 、 应 用 程序 与 服务 和 数 


地 
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据 等 。 

(1) 网 络 安全 。 它 关系 到 什么 人 和 什么 内 容 具 有 访问 权 , 查 明 任何 非法 访问 或 偶然 访 
问 的 入 侵 者 ,保证 只 有 授权 许可 的 通信 才 可 以 在 客户 机 和 服务 器 之 间 建 立 连 接 ,而 且 正在 传 
输 中 的 数据 不 能 被 读 取 和 改变 。 

(2) 服务 器 安全 。 需 要 控制 谁 能 访问 服务 器 或 访问 者 可 以 干什么 ; 防止 病毒 的 侵入 ; 
检测 有 意 或 偶然 间 和 系统 的 不 速 之 客 等 。 

(3) 用 户 安全 。 每 个 合法 的 用 户 在 系统 内 都 建立 一 个 账户 ; 在 用 户 获得 访问 权限 时 设 
置 相应 的 功能 ,在 他 们 的 访问 权限 不 再 有 效 时 删除 用 户 账 户 ; 以 及 通过 身份 验证 确保 用 户 
的 登录 是 合法 的 。 

(4) 应 用 程序 与 服务 安全 。 大 多 数 应 用 程序 和 服务 都 是 靠 口令 保护 的 ,采用 授权 控制 
用 户 访问 系统 资源 的 权限 。 

(5) 数据 安全 。 通 过 数据 加 密 防止 非法 阅读 它 ; 保证 数据 的 完整 性 ; 防止 非法 和 偶然 
的 不 正确 的 数据 更 新 。 

总 之 ,安全 措施 需要 采用 层 层 设防 的 各 种 技术 ,这 里 只 介绍 数据 库 系统 有 关 的 安全 
措施 。 

数据 库 系统 通常 采 取 的 安全 措施 包括 : 用 户 标识 与 鉴别 , 存 取 控制 ,视图 机 制 ,数据 加 
密 , 审 计 等 。 


6.4.1 用 户 标 识 与 鉴别 


用 户 标 识 与 鉴别 是 系统 提供 的 最 外 层 安全 保护 措施 。 在 数据 库 管 理 系统 中 ,数据 库 管 
理 员 (DBA) 可 以 为 数据 库 用 户 创 建 用 户 账号 和 口令 ,这样 以 后 每 次 需要 对 数据 库 进 行 存 取 
的 时 候 , 用 户 都 必须 通过 输入 账号 和 口令 才能 登录 DBMS。 每 次 用 户 要 求 进 入 系统 时 ,由 系 
统 进行 核对 ,通过 鉴定 账号 和 口令 正确 以 后 才 提供 数据 库 使 用 权 。 

用 户 标识 与 鉴别 的 方法 有 很 多 ,在 使 用 中 常常 是 几 个 方法 并 用 ,以 求 得 更 强 的 安全 性 。 
最 常用 的 方法 是 通过 用 户 账 号 和 口令 来 鉴定 用 户 身份 的 合法 性 ,这 种 方法 简单 易 行 ,但 容易 
被 别人 窃取 或 破解 。 还 可 以 采用 更 加 复杂 的 方法 ,比如 密码 可 以 与 系统 时 间 相 联系 ,使 其 随 
时 间 的 变化 而 变化 ; 或 者 采用 签名 指纹 等 用 户 个 人 特征 鉴别 等 。 此 外 ,还 可 以 重复 多 次 进 
行 用 户 标识 和 鉴别 。 


6.4.2 存 取 控制 


存 取 控 制 是 确保 具有 授权 资格 的 用 户 访问 数据 库 , 同 时 使 所 有 未 被 授权 的 人 员 无 法 访 
问 数据 库 的 机 制 。 数 据 库 用 户 按照 访问 权力 的 大 小 ,可 以 分 为 以 下 三 类 。 

1. 一 般 数据 库 用 户 

通过 授权 可 对 数据 库 进 行 操作 的 用 户 。 

2. 数据 库 的 拥有 者 

数据 库 的 拥有 者 即 数据 库 的 创建 者 ,除了 一 般 数据 库 用 户 拥 有 的 权力 外 ,还 可 以 授予 或 
收回 其 他 用 户 对 其 所 创建 的 数据 库 的 存 取 权 。 

3. 有 DBA 特权 的 用 户 

有 DBA 特权 的 用 户 即 拥有 支配 整个 数据 库 资源 的 特权 ,对 数据 库 拥有 最 大 的 特权 , 因 


而 也 对 数据 库 负 有 特别 的 责任 。 通 常 只 有 数据 库 管 理 员 才 有 这 种 特权 。DBA 特权 命令 包 
括 给 各 个 独立 的 账户 、 用 户 或 者 用 户 组 授予 特权 和 回收 特权 ,以 及 把 某 个 适当 的 安全 分 类 级 


别 指派 给 某 个 用 户 账户 。 


由 于 不 同 的 用 户 对 数据 库 具有 不 同 的 存 取 权 , 因 此 为 了 保证 用 户 只 能 访问 他 有 权 存 取 
的 数据 ,必须 对 每 个 用 户 授予 不 同 的 数据 库存 取 权 ,这 称 为 授权 CAuthorization) 。 第 一 个 具 
有 DBA 特权 的 用 户 是 由 系统 设置 的 ,在 系统 初始 化 时 ,系统 中 至 少 有 一 个 具有 DBA 特权 
的 用 户 ,例如 SYS 和 SYSTEM ,他 的 口令 也 由 系统 规定 好 。 第 一 个 DBA 用 户 进 入 系统 后 ， 


应 立即 更 换 口 令 ,以 免 别 人 盗用 该 口令 进入 系统 ,由 他 就 可 授权 给 其 他 用 户 。 


大 型 数据 库 管理 系统 都 支持 自主 存 取 控制 ,目前 的 SQL 标准 也 对 自主 存 取 控制 提供 支 


持 , 这 主要 通过 SQL 的 GRANT 语句 和 REVOKE 语句 来 实现 。 
在 SQL 中 ,授权 语句 有 两 种 : 授予 权限 语句 和 授予 角色 请 句 。 
1) 授予 权限 语句 
该 语句 基本 形式 为 : 
GRANT < 权限 > ON < 数据 对 象 > TO < 授权 者 >[WITH GRANT OPTION] 


< 数据 对 象 >: : = < 基 表 > | < 视图 > | < 属性 > | … 
< 授权 者 >: : = PUBLIC | < 授权 ID> 


其 中 ,PUBLIC 是 所 有 数据 库 用 户 的 总 称 , 若 有 WITH GRANT OPTION , 则 授权 者 可 将 此 


特权 转 授 给 其 他 授权 者 。 
例如 ,下 列 语句 : 
(1) GRANT SELECT ON Table_1 TO PUBLIC; 
将 对 表 Table_1 的 SELECT 特权 授予 所 有 的 用 户 。 
(2) GRANT INSERT(Col_1,Col 5) ON Table_1 TO sam; 
将 对 表 Table_1 中 Col_1 和 Col_5 列 的 INSERT 特权 授予 sam。 
(3) GRANT ALL PRIVILEGES ON Table_1 TO bob,sam; 
将 对 表 Table_1 的 所 有 操作 特权 授予 bob 和 sam。 


(4) GRANT UPDATE (Col_ 2.Col 4) ON Table_1 TO wang WITH GRANT OPTION:; 
将 对 表 Table_1 中 Col 2 和 Col 4 列 的 UPDATE 特权 授予 wang, 并 允许 他 将 此 特权 


转 授 给 其 他 用 户 。 
2) 授予 角色 语句 
该 语句 基本 形式 为 : 


GRANT < 角色 ID>[{, 角 色 ID}] TO< 授 权 者 >[WITH ADMIN OPTION] 


该 语句 将 一 个 或 多 个 角色 的 使 用 授予 授权 者 ,车 有 WITH ADMIN OPTION , 则 授权 


者 可 将 此 角色 转 授 给 其 他 授权 者 。 
例如 下 列 语句 中 ,假设 assistants_role,bosses_role 都 是 已 建立 的 角色 。 
(1) GRANT assistants_role,bosses_role TO PUBLIC; 
将 角色 assistants_role 和 bosses_role 授予 所 有 的 用 户 。 
(2) GRANT assistants_role TO zhang WITH ADMIN OPTION:; 


将 角色 assistants_role 授予 用 户 zhang, 并 允许 他 将 此 角色 转 授 给 其 他 授权 者 。 
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3) 收回 语句 
收回 权限 的 REVOKE 语句 : 


REVOKE < 权限 > ON < 数据 对 象 > FROM < 授权 者 >[{,< 授 权 者 >}] 
收回 角色 的 REVOKE 语句 : 
REVOKE < 角色 ID> FROM < 授权 者 >[{ ,< 授权 者 >} ] 


在 DBMS 的 数据 字典 中 为 每 个 数据 库 设 置 一 张 授 权 表 (Authorization Table) 。 此 表 存 
放 对 每 个 授权 ID 的 授权 定义 , 它 主要 由 三 部 分 组 成 , 见 表 6-4。 


表 6-4 授权 表 
授权 ID 数据 对 象 存 取 权限 


其 中 ,授权 ID 表明 用 户 或 角色 ,用 户 可 以 是 用 户 个 人 ,也 可 以 是 团体 ,程序 或 终端 。 数 
据 对 象 是 用 户 可 以 存 取 的 数据 名 称 。 在 关系 数据 库 中 ,授权 的 数据 对 象 可 以 是 基 表 、 视 图 、 
属性 列 . 行 (记录 ) 等 。 存 取 权 限 指 用 户 或 角色 可 以 执行 操作 的 类 型 ,一 般 包 括 创建 、 撤 销 、 修 
改 模式 .查找 、 插 人、 修改 .删除 等 。 

如 果 一 个 数据 库 系统 中 ,用 户 比 较 多 ,数据 库 又 比较 大 , 则 授权 表 将 会 很 大 ,而 且 每 次 对 
数据 库存 取 时 都 对 这 张 表 进行 授权 检查 ,这 将 会 影响 数据 库 的 性 能 ,所 以 在 大 多 数 数据 库 
中 ,大 部 分 数据 是 公开 的 ,可 以 一 次 性 地 授权 给 PUBLIC, 只 有 少数 的 数据 是 保密 的 ,需要 个 
别 授 权 。 在 授权 表 中 ,数据 对 象 一 般 只 细 分 到 表 , 对 于 修改 操作 可 以 细 分 到 属性 。 有 时 还 需 
要 更 细 的 存 取 限 制 , 如 与 数值 有 关 的 存 取 控制 。 例 如 , 某 学 校 的 教务 管理 信息 系统 ,只 允许 
每 个 系 的 教学 管理 员 查 询 本 系 的 学 生 的 数据 。 

当 用 户 发 出 对 数据 库存 取 的 操作 请 求 时 ,DBMS 在 数据 字典 中 查找 授权 表 , 根 据 其 存 
取 操 作 权 限 对 操作 的 合法 性 进行 检查 ,车 用 户 的 操作 请 求 超出 了 定义 的 权限 ,系统 将 拒绝 执 
行 此 操作 。 


6.4.3 视图 机 制 


通过 为 不 同 的 用 户 定义 不 同 的 视图 ,可 以 将 要 保密 的 数据 对 无 权 存 取 的 用 户 隐藏 起 来 ， 
从 而 自动 地 给 数据 提供 一 定 程度 的 安全 保护 。 例 如 ,给 某 用 户 定义 了 一 个 只 读 视 图 ,并 且 这 
个 视图 的 数据 来 源 于 关系 R, 则 此 用 户 只 能 读 R 中 的 有 关 人 信息, 数据库 中 一 切 其 他 信息 对 
它 都 是 隐藏 的 。 


6.4.4 数据 加 密 


加 密 技 术 是 防止 数据 库 中 数据 在 存储 或 者 传输 中 失 密 的 有 效 手段 。 加 密 的 基本 思想 是 
根据 一 定 的 算法 将 原始 数据 (明文 ) 变 换 成 不 可 直接 识别 的 格式 ( 密 文 ), 从 而 使 得 不 知道 解 
密 算法 的 人 无 法 获知 数据 的 内 容 。 

对 于 高 度 敏感 性 数据 ,比如 财务 数据 、 军 事 数据 、 国 家 机 密 , 除 以 上 安全 性 措施 以 外 还 可 
以 采用 数据 加 密 技术 。 如 今 加 密 技 术 已 经 比较 成 熟 了 ,有 关 密 钥 加 密 以 及 密 钥 管理 等 问题 
请 参考 有 关 书 籍 。 


由 于 数据 加 密 和 解密 是 比较 费时 的 操作 ,而 且 数 据 加 密 与 解密 程序 会 占用 大 量 的 系统 
资源 ,增加 了 系统 的 开销 ,降低 了 数据 库 的 性 能 。 因 此 ,在 一 般 数据 库 系统 中 ,数据 加 密 作为 
可 选 的 功能 ,允许 用 户 自由 选择 ,只 有 对 那些 保密 要 求 特别 高 的 数据 , 才 值 得 采用 此 方法 。 


6.4.5 审计 


前 面 讲 到 的 安全 性 措施 不 可 能 是 完美 无 缺 的 ,蓄意 盗窃 、 破 坏 数 据 的 人 总 是 想方设法 企 
图 打破 这 些 控制 。 审 计 功 能 把 用 户 对 数据 库 的 操作 自动 记录 下 来 放 入 审计 日 志 (Audit 
Log) 中 ,有 时 也 被 称 作 审计 跟踪 (Audit Trial)。 系 统 能 利用 这 些 审 计 跟 踪 的 信息 , 重 现 导 
臻 数据库 现状 的 一 系列 事件 ,以 找 出 非法 存 取 数据 的 人 。 

审计 通常 是 很 费时 间 和 空间 的 ,所 以 DBMS 往往 将 其 作为 可 选 的 ,允许 DBA 和 数据 的 
拥有 者 选择 。 数 据 库 审计 对 于 被 多 个 事务 和 用 户 更 新 的 敏感 性 数据 库 是 非常 重要 的 。 一 般 
用 于 安全 性 要 求 较 高 的 部 门 。 

最 后 应 指明 一 点 ,尽管 数据 库 系 统 提供 了 上 面 提 到 的 很 多 保护 措施 ,但 事实 上 ,没有 哪 
一 种 措施 是 绝对 可 靠 的 。 安 全 性 保护 措施 越 复杂 、 越 全 面 ,系统 的 开销 就 会 越 大 ,用 户 的 使 
用 也 会 变 得 越 困 难 ,因此 ,在 设计 数据 库 系 统 安全 性 保护 时 ,应 权衡 使 用 方法 。 例 如 ,Oracle 
数据 库 系 统 的 安全 性 措施 主要 有 三 种 : 用 户 标 识 和 鉴别 、 存 取 控制 和 审计 。 


6.5 数据 库 完整 性 


数据 库 的 完整 性 是 指数 据 库 中 数据 的 正确 性 和 相 容 性 , 即 为 了 防止 数据 库 中 存在 不 符 
合 语义 的 数据 ,防止 错误 信息 的 输入 和 输出 。 例 如 ,学 生 的 学 号 应 该 是 唯一 的 ,学 生 的 姓名 
是 4 一 8 个 字符 ; 学 生 的 年 龄 是 整数 , 取 值 范围 为 14 一 30; 学 生 所 在 的 系 必须 是 学 校 开设 的 
系 等 。 于 是 , 当 一 个 用 户 向 数据 库 插 入 一 个 新 的 学 生 记录 或 修改 一 个 学 生 的 数据 时 必须 满 
足 这些 条 件 。 这 些 条 件 称 为 完整 性 约束 条 件 ,这 些 约束 条 件 被 存 人 数据 字典 中 。 

为 了 实现 数据 库 完 整 性 ,DBMS 必须 提供 表达 完整 性 约束 的 方法 ,以 及 实现 完整 性 的 
控制 机 制 。 本 节 将 以 关系 数据 库 为 例 , 讨 论 完 整 性 控制 的 实现 。 


6.5.1 完整 性 约束 条 件 的 类 型 


完整 性 约束 条 件 作 用 的 对 象 可 以 是 列 、 元 组 关系 三 种 。 完 整 性 约束 条 件 的 类 型 可 以 分 
为 两 大 类 型 . 静态 约束 和 动态 约束 。 

1. 静态 约束 

静态 约束 是 指数 据 库 每 一 确定 状态 时 的 数据 对 象 所 应 满足 的 约束 条 件 , 它 是 反映 数据 
库 状 态 合理 性 的 约束 ,这 是 最 重要 的 一 类 完整 性 约束 。 根 据 约束 作用 的 对 象 不 同 , 又 可 分 为 
下 面 三 种 。 

1) 静态 列 约束 

静态 列 约束 是 对 一 个 列 的 取 值 域 等 的 说 明 或 限制 , 它 包 括 : 

(1) 对 数据 类 型 的 约束 ,例如 ,数据 的 类 型 .长 度 、 单 位 、 精 度 等 。 

(2) 对 数据 格式 的 约束 ,例如 .学生 的 学 号 的 格式 中 前 两 位 表示 入 学 年 份 ,中 间 两 位 为 
系 号 ,后 三 位 为 顺序 编号 。 
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(3) 对 取 值 范围 或 取 值 集合 的 约束 ,例如 ,大 学 本 科学 生年 龄 范围 的 取 值 范围 为 14 一 29。 

(4) 对 空 值 的 约束 , 空 值 表示 未 定义 或 未 知 的 值 ,与 零 值 和 空格 不 同 。 有 的 列 允许 空 
值 ,有 的 不 允许 ,例如 ,规定 学 号 成 绩 可 以 为 空 值 。 

(5) 其 他 约 东 ,例如 ,关于 列 的 排序 说 明 、 组 合 列 等 。 

2) 静态 元 组 约束 

一 个 元 组 是 由 若干 列 值 组 成 的 ,静态 元 组 约束 规定 组 成 一 个 元 组 的 各 个 列 之 间 的 约束 
关系 。 例 如 ,一 个 工厂 的 产品 库存 关系 中 包括 入 库 数 量 和 出 库 数 量 等 列 , 其 出 库 数量 不 能 大 
于 入 库 数量 。 

3) 静态 关系 约束 

静态 关系 约束 反映 了 一 个 关系 中 各 个 元 组 之 间或 者 若干 关系 之 间 存 在 的 联系 或 约束 。 
它 包括 : 

(1) 实体 完整 性 约束 , 即 关键 字段 的 值 不 为 空 。 

(2) 参照 完整 性 约束 , 即 一 个 关系 的 外 码 取 值 与 另 一 个 关系 的 关键 字 的 值 有 关 。 

(3) 函数 依赖 约束 ,大 部 分 函数 依赖 约束 都 在 关系 模式 中 定义 。 

(4) 统计 约束 , 即 某 个 字段 值 与 一 个 关系 多 个 元 组 的 统计 值 之 间 的 约束 关系 。 例 如 ,对 
学 生平 均 成 绩 的 约束 等 ,这 里 的 平均 成 绩 就 是 统计 值 。 

动态 约束 是 指数 据 库 从 一 种 状态 转变 为 男 一 种 状态 时 ,新 、 旧 值 之 间 所 满足 的 约束 条 
件 , 它 反映 了 数据 库 状态 改变 时 应 遵守 的 约束 。 按 照 约 束 的 对 象 不 同 , 它 又 分 为 下 面 三 种 。 

1) 动态 列 约束 

动态 列 约束 规定 修改 列 定义 或 列 值 时 应 满足 的 约束 条 件 , 它 包 括 : 

(1) 修改 列 定义 时 的 约束 。 例 如 ,将 允许 空 值 的 列 改 为 不 允许 空 值 时 ,如 果 该 列 目前 已 
存在 空 值 , 则 拒绝 这 种 修改 。 

(2) 修改 列 值 时 的 约束 。 修 改 列 值 时 需要 参照 其 旧 值 ,并 且 新 旧 值 之 间 需 要 满足 某 种 
约束 条 件 。 例 如 ,学 生 的 年 龄 只 能 增长 。 

2) 动态 元 组 约束 

动态 元 组 约束 是 指 修改 某 个 元 组 的 值 时 元 组 中 的 各 个 字段 之 间 要 满足 某 种 约束 条 件 。 
例如 ,退休 职工 工资 不 得 低 于 原 基本 工资 (元 ) 的 80% 十 工龄 X1.5( 元 ) 等 。 

3) 动态 关系 约束 

动态 关系 约束 是 加 在 关系 变化 时 的 限制 条 件 ,例如 ,事务 一 致 性 .原子 性 等 约束 条 件 。 


6.5.2 完整 性 控制 机 制 的 功能 


DBMS 的 完整 性 控制 机 制 应 该 具有 如 下 三 个 方面 的 功能 。 

1. 定义 功能 

提供 定义 完整 性 约束 条 件 的 机 制 。 完 整 性 约束 条 件 有 的 比较 简单 .有 的 比较 复杂 ,一 个 
完整 的 完整 性 控制 机 制 应 该 允许 用 户 定义 所 有 的 完整 性 约束 条 件 。 

2. 检查 功能 

检查 用 户 发 出 的 操作 请 求 是 否 违 反 了 完整 性 约束 条 件 。 检 查 是 否 违背 完整 性 约束 条 件 
通常 是 在 一 条 语句 执行 后 立即 检查 , 这 类 约束 称 为 立即 执行 的 约束 (Immediate 


Constraints) 。 而 在 某 些 情况 下 ,完整 性 检查 需要 延迟 到 整个 事务 结束 后 再 进行 ,这 类 约束 
称 为 延迟 执行 的 约束 (Deferred Constraints)。 例 如 ,财务 管理 中 ,一 张 记 账 凭证 中 “借贷 总 
金额 应 相等 ”的 约束 就 应 该 是 延迟 执行 的 约束 。 只 有 当 一 张 记 账 凭证 输入 完 后 才能 达到 借 
贷 总 金额 相等 ,这 时 才能 进行 完整 性 检查 。 

3. 保护 功能 

如 果 发 现 用 户 的 操作 请 求 违背 了 完整 性 约束 条 件 , 则 采取 一 定 的 保护 动作 来 保证 数据 
的 完整 性 。 最 简单 的 保护 数据 完整 性 的 动作 就 是 拒绝 该 操作 ,但 也 可 以 采取 其 他 处 理 方法 。 
如 果 发 现 用 户 操作 请 求 违背 了 延迟 执行 的 约束 ,由 于 不 知道 是 哪个 或 哪些 操作 破坏 了 完整 
性 ,所 以 只 能 拒绝 整个 事务 ,把 数据 库 恢复 到 该 事务 执行 前 的 状态 。 

目前 许多 关系 数据 库 管理 系统 都 提供 了 定义 和 检查 实体 完整 性 ,参照 完整 性 和 用 户 定 
义 的 完整 性 的 功能 。 对 于 违反 实体 完整 性 约束 和 用 户 定 义 的 完整 性 约束 的 操作 一 般 都 以 拒 
绝 执行 的 方式 进行 处 理 。 而 对 于 违反 参照 完整 性 的 操作 ,并 不 都 是 简单 地 拒绝 执行 ,有 时 接 
受 这 个 操作 ,但 同时 执行 一 些 附加 的 操作 ,以 保证 数据 库 的 状态 仍 是 正确 的 。 


6.5.3 完整 性 约束 的 表达 方式 


通常 有 下 面 几 种 方法 表达 完整 性 约束 条 件 。 

1. 在 创建 和 修改 基 表 模式 时 说 明 约 束 

在 SQL 中 ,使 用 CREATE TABLE 创建 基 表 时 ,通过 定义 列 的 类 型 说 明 列 的 约束 ; 如 
定义 主键 (PRIMARY KEY) 说 明 实 体 完整 性 约束 ; 定义 外 键 (FOREIGN KEY) 以 及 执行 
删除 操作 时 限定 动作 说 明 参 照 完整 性 约束 。 此 外 ,还 可 以 利用 CHECK 子 句 表示 单 表 中 的 
约束 ,尤其 是 说 明 各 列 的 值 应 满足 的 约束 条 件 。 在 使 用 ALTER TABLE 修改 基 表 模式 时 ， 
也 可 以 修改 约束 说 明 。 下 面 主要 介绍 创建 基 表 时 的 约束 说 明 。 

1) SQL 中 的 关键 字 

在 CREATE TABLE 中 声明 某 个 属性 或 属性 集 作为 某 个 关系 的 关键 字 , 是 数据 库 中 最 
为 重要 的 约束 ,其 方法 有 两 种 : 一 是 使 用 保留 字 PRIMARY KEY( 主 关键 字 ) ,二 是 使 用 保 
留 字 UNIQUE。 在 一 个 表 中 只 有 一 个 PRIMARY KEY, 但 可 能 有 几 个 UNIQUE。 

一 个 关系 的 主 关键 字 由 一 个 或 几 个 属性 构成 ,在 CREATE TABLE 中 声明 主 关 键 字 的 
方法 如 下 。 

(1) 在 列 出 关系 模式 的 属性 时 ,在 属性 及 其 类 型 后 加 上 保留 字 PRIMARY KEY ,表示 
该 属性 是 主 关键 字 。 

(2) 在 列 出 关系 模式 的 所 有 属性 后 ,再 附加 一 个 声明 : 

PRIMARY KEY (< 属性 1 >[ ,< 属性 2>, … ]) 

如 果 关 键 字 由 多 个 属性 构成 , 则 必须 使 用 第 二 种 方法 。 下 面 的 例 6-1 和 例 6-2 是 对 同 
一 个 关系 模式 的 两 种 不 同 描述 。 

【 例 6-1] 


CREATE TABLE MovieStar 
(name CHAR( 30) PRIMARY KEY, 
address VARCHAR(255), 
gender CHAR(1), 
birthdate DATE); 
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【 例 6-2 


CRERTE TABLE MovieStar 

(name CHAR( 30), 
address VARCHAR(255), 
gender CHAR(1), 
birthdate DATE 
PRIMARY KEY (name)); 


如 果 使 用 保留 字 UNIQUE 来 说 明 关 键 字 , 则 它 可 以 出 现在 PRIMARY KEY 出 现 的 任 
何 地 方 , 不 同 的 是 , 它 可 以 在 同一 个 关系 模式 中 出 现 多 次 。 例 如 ,可 以 将 例 6-1 改写 为 : 
CREATE TABLE MovieStar 
(name CHAR( 30) UNIQUE, 
address VARCHAR(255), 
gender CHAR(1), 
birthdate DATE); 
2) 参照 完整 性 和 外 部 关键 字 
参照 完整 性 是 关系 模式 的 另 一 种 重要 约束 。 根 据 参 照 完 整 性 的 概念 , 当 一 个 关系 的 某 
个 或 某 几 个 属性 被 说 明 为 外 部 关键 字 的 时 候 , 要 引用 或 参照 第 二 个 关系 的 某 个 或 某 几 个 属 
(1) 被 参照 的 第 二 个 关系 的 属性 必须 是 该 关系 的 主 关 键 字 。 
(2) 对 于 第 一 个 关系 中 外 关键 字 的 任何 值 ,也 必须 出 现在 第 二 个 关系 的 相应 属性 上 , 即 
参照 完整 性 约束 把 这 两 个 属性 或 属性 集 联系 起 来 了 。 
在 SQL 中 ,有 以 下 两 种 方法 用 于 说 明 一 个 外 部 关键 字 。 
第 一 种 方法 ,如 果 外 部 关键 字 只 有 一 个 属性 ,可 以 在 它 的 属性 名 和 类 型 后 面 直接 用 
“REFERENCES? 说 明 它 参照 了 某 个 被 参照 表 的 某 些 属性 (必须 是 主 关 键 字 ) ,其 格式 为 : 


REFERENCES < 表 名 >(< 属 性 >) 

另 一 种 方法 是 ,在 CREATE TABLE 语句 的 属性 列表 后 面 增加 一 个 或 几 个 外 部 关键 字 
说 明 ,其 格式 为 : 

FOREIGN KEY < 属性 > REFERENCES < 表 名 >(< 属 性 >) 


其 中 ,第 一 个 “属性 ?是 外 部 关键 字 ,第 二 个 “属性 ?是 被 参照 的 属性 。 
【 例 6-3】 设 有 一 个 关系 模式 


employee( eno, ename, esex, dno) 

其 中 ,eno 是 主 关键 字 ,dno 是 外 部 关键 字 , 它 参照 了 关系 模式 
department (deptno, dname, address) 

中 的 deptno, 这 时 可 以 直接 说 明 dno 参照 了 deptno: 


CREATE TABLE employee 
(eno CHAR(6) PRIMARY KEY, 
ename VARCHAR( 8), 


gender CHAR(1), 
dno CHAR(2) REFERENCES department(deptno) ) ; 


或 者 这 样 说 明 : 


CREATE TABLE employee 
(eno CHAR(6) PRIMARY KEY, 
ename VARCHAR( 8), 
gender CHAR(1), 
dno CHAR(2) 
FOREIGN KEY dno REFERENCES department (deptno) ); 

值得 注意 的 是 ,因为 关系 department 中 的 deptno 是 关系 employee 中 的 外 部 关键 字 ， 
所 以 ,在 department 中 必须 把 属性 deptno 说 明 为 主 关键 字 。 

维护 参照 完整 性 约 东 的 策略 有 以 下 几 种 。 

(1) 默认 策略 : 拒绝 违规 的 更 新 。 

对 于 任何 违反 了 参照 完整 性 约束 的 数据 更 新 (INSERT、DELETE、UPDATE) ,系统 一 
概 拒绝 执行 。 

(2) 级 联 策略 (Cascade Policy) 。 

以 例 6-3 的 删除 操作 为 例 , 当 从 被 参照 关系 department 中 删除 一 个 元 组 的 时 候 , 为 了 
维护 参照 完整 性 ,系统 将 自动 地 从 关系 employee 中 删除 那些 参照 元 组 。 而 当 执 行 修改 操作 
时 ,例如 ,把 department 中 deptno 某 个 元 组 的 值 dl 改 为 42, 则 在 employee 关系 中 ,对 于 属 
性 dno, 凡 是 以 dl 作为 其 值 的 那些 元 组 上 的 dno 值 , 也 将 改 为 d2。 

(3) 置 空 NULL) 策 略 。 

有 时 候 , 对 于 被 参照 关系 的 删除 和 修改 操作 是 独立 进行 的 ,这 时 可 以 采用 置 NULL 策 
略 。 方 法 是 ,在 用 CREATE TABLE 语句 建立 带 有 外 部 关键 字 的 关系 模式 时 ,在 模式 后 面 
加 上 ON DELETE SET NULL 或 ON UPDATE CASCADE。 例 如 ,对 例 6-3: 


CREATE TABLE employee 
(eno CHAR(6) PROMARY KEY, 
ename VARCHAR( 8), 
gender CHAR(1), 
dno CHAR(2) REFERENCES department(deptno) 
ON DELETE SET NULL 
ON UPDATE CASCADE); 


ON DELETE SET NULL 子 句 表示 : 当 删 除 被 参照 关系 department 的 某 些 元 组 时 ,在 
参照 关系 employee 中 ,对 于 取 被 删除 的 department. deptno 值 的 那些 元 组 上 的 dno 值 , 将 
置 为 NULL。ON UPDATE CASCADE 子 句 表示 : 如 果 修 改 了 某 些 department. deptno 的 
值 ,对 于 employee 中 取 这 些 值 的 元 组 ,也 将 做 同样 的 修改 。 

3) 关于 属性 值 的 约束 

对 属性 值 的 约束 是 关系 模型 中 的 第 三 类 重要 约束 。 这 些 约束 的 表达 方式 是 : 在 关系 
模式 的 定义 中 对 属性 进行 约束 ; @ 首 先 约束 某 个 域 .然后 再 说 明 它 是 某 个 属性 的 域 。 

(1) 非 空 (NULL) 约 束 。 

对 于 属性 值 的 约束 ,最 简单 的 方法 是 限制 属性 值 不 为 空 。 其 表示 约束 的 方法 是 ,在 建立 
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关系 模式 时 ,在 属性 说 明 后 面 再 加 上 保留 字 “NOT NULL”。 在 把 一 个 属性 约束 为 “NOT 
NULL” 后 ,就 不 能 将 该 属性 的 值 修 改 为 空 或 者 插入 一 个 空 值 ,也 不 能 对 它 使 用 置 空 策略 。 

(2) 基于 属性 值 检 查 CCHECK) 的 约束 。 

这 种 方式 下 对 于 属性 值 的 约束 条 件 表示 为 

CHECK (< 条 件 >) 

意思 是 ,该 属性 上 的 每 一 个 值 都 要 满足 CHECK 后 面 的 条 件 。 这 个 条 件 可 能 是 指正 在 
被 约束 的 属性 ,也 可 能 是 指 FROM 子 句 引 出 的 其 他 关系 或 关系 的 属性 。 当 被 约束 的 属性 获 
得 一 个 新 值 的 时 候 , 就 按 CHECK 后 面 的 条 件 对 新 值 进行 检查 ,如果 新 值 违反 约束 条 件 , 系 
统 拒绝 更 新 属性 值 。 当 然 ,如 果 数 据 库 修改 不 改变 被 约束 属性 的 原 值 , 则 不 进行 约束 检查 。 

【 例 6-4】 在 例 6-3 中 ,如 果 只 允许 属性 gender 的 值 是 字符 “F”( 女 ) 或 “M”( 男 ), 则 对 
属性 gender 的 描述 修改 为 : 

gender CHAR(1) CHECK (gender IN ('F', 'M')), 
表示 属性 gender 每 次 只 能 取 集 合 {'F','M'}) 中 的 一 个 元 素 作为 其 值 。 

(3) 域 约束 。 

通过 声明 一 个 域 来 约束 某 个 属性 的 取 值 。SQL2 通过 保留 字 VALUE 指示 域 中 的 值 。 
例如 ， 


CREATE DOMAIN GenderDomain CHAR(1) 
CHECK (VALUE IN ('F', M')); 


如 果 要 通过 域 GenderDomain 来 限制 属性 gender 的 取 值 , 则 定义 如 下 : 


gender GenderDomain 
保留 字 VALUE 后 面 还 可 以 是 比较 运算 符 。 例 如 ,如 果 要 求 部 门 编号 dno 为 三 位 数 
字 , 首 先 建立 一 个 域 : 


CREATE DOMAIN DnoDomain INT 
CHECK (VALUE >= 100); 


然后 用 于 定义 属性 dno: 
dno DnoDomain REFERENCES department (deptno) 


这 也 可 以 达到 限制 一 个 属性 值 域 的 目的 。 

4) 全 局 约束 

有 时 候 , 一 个 复杂 的 约束 条 件 可 能 涉及 几 个 属性 甚至 几 个 不 同 关 系 之 间 的 联系 , 称 为 全 
局 约束 。 这 类 约束 又 分 为 两 种 : 第 一 种 是 基于 元 组 检查 (CHECK) 的 约束 , 它 用 于 限制 单个 
关系 的 元 组 ; 另 一 种 是 断言 (ASSERTION) , 它 可 能 涉及 整个 关系 或 以 同一 关系 作为 值 域 的 
几 个 元 组 变量 。 下 面 讨论 基于 元 组 检查 的 约束 ,关于 断言 见 下文 。 

为 了 说 明 对 单个 关系 人 上 元 组 的 约束 ,可 以 在 定义 关系 模式 的 时 候 ,在 对 各 个 属性 描 
述 以 后 ,增加 一 个 CHECK 子 句 ,指出 关系 R 中 所 有 元 组 应 该 满足 的 条 件 。 其 格式 为 : 


CHECK (< 条 件 >) 


其 中 的 条 件 可 以 是 WHERE 子 句 中 出 现 的 任何 条 件 , 但 可 能 涉及 子 查询 、 其 他 关系 或 同一 
关系 的 其 他 元 组 。 

每 当 往 关系 R 中 插入 元 组 ,或 修改 R 中 的 元 组 时 ,系统 就 检测 CHECK 子 句 后 面 的 条 
件 是 否 满足 。 注 意 ,条 件 求 值 是 相对 于 插入 的 新 元 组 或 修改 的 元 组 进行 的 。 如 果 条 件 不 满 
足 , 系 统 将 拒绝 执行 元 组 插入 或 修改 。 然 而 ,如 果 条 件 涉 及 子 查询 中 某 个 关系 ,甚至 是 R 本 
身 , 并 且 对 该 关系 的 改变 使 得 条 件 在 R 的 某 个 元 组 上 不 成 立 ,这 时 ,约束 检测 就 失去 作用 ， 
即 不 能 阻止 这 个 改变 。 

虽然 基于 元 组 检查 的 约束 可 以 包含 非常 复杂 的 条 件 , 但 最 好 是 使 用 下 面 的 SQL 断言 ， 
原因 正如 上 面 所 讨论 的 ,在 某 些 情况 下 ,基于 元 组 检测 的 约束 可 能 失效 。 一 般 来 说 ,如 果 基 
于 元 组 检测 的 约束 只 涉及 正在 被 检查 的 元 组 的 属性 ,并 且 没 有 子 查询 , 则 这 种 约束 总 是 有 
效 的 。 

【 例 6-5】 将 例 6-3 改 为 : 

CREATE TABLE employee 

(eno CHAR(6) PROMARY KEY, 

ename VARCHAR( 8), 

gender CHAR(1), 

dno CHAR(2) REFERENCES department(deptno), 
CHECK (gender = 'F'OR dno<>'d1')); 

该 约束 条 件 表示 ,对 于 所 有 的 女性 或 不 在 dl 部 门 工作 的 人 ,该 约束 条 件 均 为 真 。 

2. 用 断言 说 明 约 柬 

一 个 断言 就 是 一 个 谓词 ,用 以 说 明 数 据 库 状态 必须 满足 的 一 个 条 件 。 为 了 用 断言 说 明 
约束 ,在 数据 库 语 言 中 须 提 供 表述 断言 的 语句 。 在 SQL2 语言 标准 中 可 用 CREATE 
ASSERTION 语句 来 说 明 断 言 。 该 语句 的 形式 为 : 

CREATE ASSERTION < 约束 名 > CHECK (< 条 件 >) 


一 个 断言 中 的 条 件 必须 保持 为 真 ,并 且 ,不 管 什 么 样 的 数据 库 操作 ,只 要 它 破坏 了 断言 
中 的 条 件 (使 条 件 为 假 ) ,系统 就 拒绝 执行 。 可 见 ,与 属性 值 约束 或 元 组 值 约束 相 比 ,大 大 加 
强 了 约束 力度 。 

【 例 6-6】 设 有 关系 模式 : 


student( sno, sname, sex, age, status) 
course(cno, cname, credit) 
s_c(sno, cno, grade) 


其 中 ,student 中 的 status 属性 依据 s_c 中 的 grade 值 取 优 秀 、 良 好 。 这 时 ,可 以 建立 下 面 的 
断言 约束 : 
CREATE ASSERTION Stat_Ass CHECK 
(EXISTS 
(SELECT sno, sname 


FROM student, course,s_c 
WHERE student. sno = s_c. sno AND course. cno = s_c.cno AND s_c. grade>85)); 


表示 一 个 学 生 的 成 绩 如 果 是 优秀 或 良好 , 则 他 必须 选修 了 有 关 课 程 ,并 且 考 试 成 绩 在 85 分 
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DE 
言 约 束 也 可 以 用 于 一 个 关系 。 例 如 ,在 关系 模式 


test( sno, sname, cname, score) 


中 ,如 果 要 求 每 个 考生 的 总 分 不 大 于 750 分 ,可 以 建立 下 面 的 断言 约束 : 


CRERTE ASSERTION SumScore CHECK 
(750>= ALL 
(SELECT SUM( score) 
FROM test 
GROUP BY sno)); 


在 SQL3 语言 标准 中 说 明 断 言 的 语句 的 形式 为 : 

CREATE ”ASSERTION ”< 约束 名 > 

CHECK (< 搜索 条 件 >) [< 约束 属性 >] 
其 中 ,搜索 条 件 是 任何 合法 的 条 件 表达 式 。SQL3 在 以 下 两 个 主要 方面 扩充 了 SQL2 中 的 
断言 。 

(1) SQL3 中 的 触发 断言 的 事件 由 数据 库 程 序 员 指 定 ,而 不 是 由 系统 确定 的 违反 约束 条 
件 的 事件 。 

(2) SQL3 中 的 断言 的 检验 ,不 一 定 指 整个 表 , 也 可 以 像 元 组 级 检查 那样 ,表示 某 个 表 的 
每 个 元 组 。 

【 例 6-7】 对 于 例 6-6, 按 SQL3 标准 写 出 断言 如 下 。 


(1) CREATE ASSERTION Stat_Rss CHECK 
(2) AFTER 

(3) INSERT ON s_c, 

(4) UPDATE OF sno ON s_c, 

(5) UPDATE OF cno ON s_c, 

(6) UPDATE OF grade ON s_c 

(7) DELETE ON s_c 

(8) CHECK (NOT EXISTS 

(9) (SELECT * 

(10) FROM student, course,s_c 
(11) WHERE student. sno = s_c. sno AND course. cno = s_c.cno 


RND s_c.grade > 85)); 


本 例 中 , 行 (2) 一 (7) 列 出 了 一 系列 能 够 触发 断言 检查 的 事件 , 行 (8) 一 (11) 表 示 约 东 条 
件 , 凡 是 对 关系 s_c 的 插入 、 修 改 或 删除 操作 ,都 受到 这 个 条 件 的 限制 。 

SQL3 断言 与 SQL2 断言 的 主要 区 别 , 正 如 例 6-7 所 示 的 那样 ,在 SQL3 断言 中 , 何 时 需 
要 执行 检查 ,是 非常 明显 的 ,从 而 使 得 系统 更 容易 实现 ,但 对 用 户 来 说 要 找 出 所 有 可 能 触发 
断言 的 事件 就 较为 困难 了 。 

删除 一 个 断言 的 语句 格式 是 : 


DROP ASSERTION < 断言 名 >; 


【 例 6-8】 删除 断言 Stat_Ass 的 语句 为 : 
DROP ASSERTION Stat_Ass; 


断言 创建 之 后 ,系统 会 检测 其 有 效 性 。 若 断言 有 效 , 则 将 它 存 放 在 约束 库 中 ,以 后 只 有 
不 违背 断言 的 数据 库 修改 才 允 许 。 由 于 检测 和 维护 断言 的 开销 较 高 ,特别 是 对 较 复 杂 的 断 
言 , 因 此 ,使 用 断言 时 应 小 心 。 

3. 用 触发 器 表示 约束 

触发 器 是 一 条 语句 , 当 对 数据 库 修 改 时 , 它 自动 被 系统 执行 。 一 个 触发 器 应 包括 下 面 两 
个 功能 。 

(1) 指明 什么 条 件 下 触发 器 被 执行 。 

(2) 指明 触发 器 执行 什么 动作 。 

利用 触发 器 表示 约束 ,以 违背 约束 作为 条 件 ,以 违背 约束 的 处 理 作 为 动作 。 该 动作 可 以 
是 回 滚 事务 ,也 可 以 发 给 用 户 一 个 消息 或 执行 一 个 过 程 。 为 了 利用 触发 器 表示 约束 ,相应 的 
数据 库 语 言 或 系统 应 有 触发 器 机 制 。 在 SQL2 中 没有 触发 器 机 制 ,而 在 SQL3 中 ,可 用 
CREATE TRIGGER 语句 来 定义 触发 器 。SQL3 触发 器 定义 如 下 。 


< 触发 器 >: : = CREATE TRIGGER < 触发 器 > 
{BEFORE| AFTER} < 触发 事件 > ON < 表 名 > 
[REFERENCING < 引用 名 列表 >] 
[FOR EACH {ROW|STATEMENT} ] 
[WHEN(< 条 件 >)] 
< 动作 > 
< 触发 事件 >: : = INSERT|DELETE|UPDATE[ OF < 属性 名 >[{,< 属 性 名 >}…] 
< 引用 名 >: : = OLD [ROW] [AS]< 旧 元 组 名 >| 
NEW [ROW] [AS] < 新 元 组 名 >| 
OLD TABLE [AS] < 旧 表 名 >| 
NEW TABLE [AS] < 新 表 名 > 
< 动作 >: : = SQL 语句 |BEGIN ATOMIC {SQL 语句 ;} …END 


上 述 定义 中 , 方 括号 是 可 选项 目 ,CREATE TRIGGER 语句 建立 一 个 新 的 触发 器 ,触发 
事件 仅 限于 基 表 的 更 新 操作 , 即 插入 、 删 除 和 修改 。 修 改 时 可 指明 对 哪些 属性 修改 , 若 不 指 
明 则 对 元 组 修改 。ON 子 句 指明 触发 事件 是 对 哪个 基 表 。 对 每 个 表 名 可 建立 多 个 触发 器 ， 
但 一 个 表 名 中 各 个 触发 器 名 必须 唯一 。{BEFORE | AFTER} 表示 可 以 在 BEFORE 和 
AFTER 两 者 之 中 任 选 一 项 ,分 别 表示 在 事件 前 触发 和 事件 后 触发 。 条 件 可 以 是 任意 的 
SQL 谓词 , 即 可 用 于 WHERE 子 句 的 任何 谓词 。 动 作 是 一 个 SQL 语句 或 多 个 SQL 请 句 。 
多 个 SQL 语句 需要 用 BEGIN ATOMIC…END 子 句 界 定 , 每 个 SQL 语句 用 分 号 隔 开 。 但 
动作 中 不 能 含有 宿主 变量 和 参数 引用 。 

如 果 和 触发 事件 是 对 表 的 更 新 操作 , 且 更 新 操作 的 对 象 是 元 组 集 , 这 时 存在 触发 的 动作 是 
对 每 个 元 组 ( 行 ) 分 别 执行 呢 ? 还 是 只 发 生 一 次 (对 于 这 个 语句 )? 为 此 要 在 语句 中 用 FOR 
EACH ROW 或 FOR EACH STATEMENT 加 以 指明 。 例 如 ,Employees 表 建 立 了 一 个 触 
发 器 : 


CREATE TRIGGER TE 
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AFTER UPDATE OF CL_1 ON EMPLOYEES 


当 执 行 UPDATE EMPLOYEES SET CL _1=5 语句 时 ,假设 EMPLOYEES 表 有 1000 
行 ,如 果 触 发 器 TE 中 指明 为 FOR EACH STATEMENT, 则 触发 动作 只 发 生 一 次 ; 如 果 为 
FOR EACH ROW , 则 触发 器 动作 发 生 1000 次 (每 一 行 一 次 ); 如 果 没 有 指明 ,默认 为 FOR 
EACH STATEMENT。 

更 新 操作 势必 引起 数据 库 中 某 些 值 的 改变 。 将 旧 值 变 为 新 值 。 在 触发 器 的 条 件 和 动作 
中 可 能 引用 旧 值 或 新 值 。 为 了 引用 它 , 必 须 把 它 定 义 为 一 个 引用 名 ( 即 变 量 名 ) ,在 
REFERENCE 子 句 中 定义 它们 。 在 引用 名 定义 中 ,可 定义 单个 元 组 ( 行 ) 的 旧 、 新 值 的 旧 元 
组 名 和 新 元 组 名 ,用 于 对 每 个 元 组 执行 和 触发 动作 ; 也 可 定义 一 个 表 的 旧 、 新 值 的 旧 表 名 和 
新 表 名 ,用 于 对 语句 执行 触发 动作 。 例 如 , 设 新 的 元 组 值 的 引用 名 定义 为 NROW, 则 可 
写成 : 

REFERENCING NEW AS NROW 
或 

REFERENCING NEW NROW 

设 旧 的 表 的 引用 名 为 OTABLE, 则 可 写成 : 


REFERENCING OLD TABLE AS OTABLE 


REFERENCING OLD TABLE OTABLE 
【 例 6-9】 设 有 模式 
emp( eno, ename, gender, age, address, salary) 


下 面 的 SQL3 触发 器 , 当 被 修改 元 组 的 salary 值 小 于 原来 的 salary 值 时 被 触发 ,并 将 它 
恢复 到 原 值 。 


(1) CREATE TRIGGER TriggerOfSalary 


(2) AFTER UPDATE OF salary ON emp 

(3) REFERENCING 

(4) OLD AS OldTuple 

(5) NEW AS NewTuple 

(6) WHEN (OldTuple. salary > NewTuple. salary) 
(7) UPDATE emp 

(8) SET salary = OldTuple. salary 

(9) WHERE eno = NewTuple. eno 

(10) FOR EACH ROW 


其 中 , 行 (1) 用 保留 字 CREATE TRIGGER 引入 触发 器 的 名 ; 行 (2) 给 出 触发 事件 ,本 例 中 
是 修改 关系 emp 中 属性 salary 的 值 ; 行 (3) 一 (5) 为 触发 器 的 条 件 和 动作 设置 一 种 方法 , 即 
把 修改 以 前 的 元 组 指定 为 OldTuple, 把 修改 以 后 的 元 组 指定 为 NewTuple; 行 (6) 是 触发 器 
的 条 件 部 分 ,表示 当 增 加 以 后 的 工资 值 小 于 原 有 工资 时 ,就 立即 触发 执行 相应 的 动作 ; 行 


(7) 一 (9) 是 触发 器 的 动作 部 分 , 它 实 际 上 就 是 SQL 的 修改 语句 ,其 作用 是 恢复 被 修改 元 组 
的 salary 值 , 被 恢复 的 元 组 由 行 (9) 保 证 。 最 后 一 行 表 达 了 对 于 每 个 被 修改 的 元 组 ,就 进行 
一 次 触发 检查 。 如 果 省 去 第 (10) 行 ,那么 ,对 于 任何 一 个 SQL 修改 语句 ,就 要 触发 执行 一 
次 ,而 不 管 修改 了 多 少 个 元 组 。 

在 SQL3 中 可 用 DROP TRIGGER 语句 撤销 一 个 触发 器 ,其 语法 如 下 : 

DROP TRIGGER < 触发 器 名 > 


只 有 该 触发 器 拥有 者 或 授权 者 才能 撤销 。 

在 触发 器 中 表示 的 条 件 是 违背 约束 的 条 件 , 而 断言 中 表示 的 是 数据 库 状态 应 满足 的 条 
件 , 两 者 恰好 相反 。 

4. 用 过 程 说 明 约 束 

除了 上 面 介绍 的 用 数据 库 语 言 提 供 的 语句 说 明 约 束 外 ,还 可 以 在 应 用 程序 中 插入 一 些 
过 程 ,以 检验 数据 库 更 新 是 否 违背 给 定 的 约束 。 如 果 违 背 约束 , 则 回 滚 事务 。 检 验 约 束 的 过 
程 一 般 用 通用 高 级 程序 设计 语言 编写 ,可 以 表达 各 种 约束 ,比较 灵活 。 但 由 于 检验 约束 的 过 
程 是 分 散在 应 用 程序 中 ,增加 了 程序 员 的 负担 ,也 容易 出 错 或 被 忽略 ; 维护 的 工作 量 也 比较 
大 ,约束 一 旦 改变 ,对 应 用 程序 要 做 相应 的 修改 。 

总 之 ,在 创建 基 表 时 说 明 约 束 是 最 基本 的 ,也 比较 容易 ; 而 用 断言 或 触发 器 说 明 约 束 较 
为 灵活 ,但 开销 稍 大 ; 而 用 过 程 说 明 约 束 更 为 一 般 ,但 容易 出 错 和 增加 应 用 程序 维护 工 
作 量 。 


小 结 


数据 库 系统 的 正常 运行 是 通过 数据 库 的 保护 实现 的 , 即 数据 库 恢 复 、 并 发 控制 数据 库 
安全 性 和 完整 性 。 本 章 主 要 介绍 了 数据 库 恢复 、 并 发 控制 .数据库 安全 性 和 完整 性 4 个 方面 
的 概念 和 实现 的 基本 方法 。 包 括 事务 的 基本 概念 事务 的 特性 、 故 障 的 种 类 ,数据 库 恢复 的 
基本 原则 和 实现 方法 ; 并 发 操作 带 来 的 问题 .调度 - 串 行 调度 -并 发 调度 以 及 可 串 行 化 的 概 
念 、 基 于 封锁 的 并 发 控制 技术 ,三 级 封锁 协议 和 两 段 锁 协 议 , 死 锁 的 检测 和 处 理 ; 数据 库 安 
全 性 的 定义 \ 数 据 库 安全 性 控制 采取 的 一 些 措施 ; 数据 库 完整 性 的 定义 、 完 整 性 约束 条 件 的 
类 型 完整 性 控制 机 制 的 功能 、 完 整 性 约束 的 表达 方式 ,并 用 SQL 请 句 给 出 了 如 何 描述 授 
权 、 角 色 、 建 立 视图 以 及 约束 的 方式 等 。 

学 习 这 些 概念 ,目的 是 帮助 读者 在 使 用 数据 库 产 品 时 ,能 够 很 快 掌握 和 运用 系统 提供 的 
数据 库 管理 方法 和 保护 功能 。 


习 题 6 


6.1 什么 是 事务 ? 它 与 一 般 的 程序 有 什么 不 同 ? 为 什么 一 般 程 序 不 提 ACID 特性 ? 

6.2 什么 是 日 志文 件 ? 为 什么 要 使 用 日 志文 件 ? 登记 日 志文 件 时 为 什么 必须 先 写 日 
志文 件 , 后 写 数据 库 ? 日 志文 件 能 否 和 数据 库存 储 在 一 起 ?为 什么 ? 

6.3 数据 库 运行 过 程 中 常见 的 故障 有 哪 几 类 ? 试 述 对 各 类 故障 的 恢复 策略 。 
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6.4 什么 是 检查 点 ? 设置 检查 点 有 什么 作用 ? 设置 检查 点 时 系统 将 做 什么 动作 ? 
6.5 给予 下 述 问题 的 简要 回答 。 
(1) 什么 是 并 发 ? 
(2) 并 发 操作 会 引起 什么 问题 ? 
(3) 什么 是 丢失 更 新 ? 
(4) 什么 是 读 脏 数 据 ? 
(5) 什么 是 读 值 不 可 复 现 ? 
(6) 什么 样 的 并 发 操作 是 正确 的 ? 
(7) 串 行 调 度 和 可 串 行 化 调度 有 什么 区 别 ? 
6.6 有 两 个 事务 : 
Ti: lock(A) .lock(B) ,unlock(A).,unlock(B) 
T,: lock(CB) ,unlock(B) ,lock(A) ,unlock(A) 
它们 有 多 少 种 合法 调度 ? 其 中 有 多 少 种 是 可 串 行 化 的 ? 
6.7 什么 是 两 段 锁 协议 ? 什么 是 严格 的 2PL 协议 ? 如 何 实现 2PL 协议 ? 
6.8 什么 叫 活 锁 ? 如 何 防止 活 锁 ? 
6.9 什么 叫 死 锁 ? 如 何 预防 和 处 理 死 锁 ? 
6.10 设 有 两 个 事务 的 一 个 调度 S 
Ti1: Write(A) ,T : Write(B) ,Ti ， Write(B) ,T: ， Write(A) 
下 一 一 时 间 标 记 为 20,T: 一 一 时 间 标 记 为 30。 
请 说 明 Ti ,Ts 在 2PL 协议 下 的 执行 过 程 ,及 其 等 效 的 串 行 执行 次 序 。 
6.11 什么 是 数据 库 的 安全 性 和 完整 性 ? 两 者 之 间 有 什么 联系 和 区 别 ? 
6.12 假设 有 如 下 两 个 关系 模式 : 
Emp(Eno, Ename, Eage, Salary, Deptno) 
Dept (Deptno, Dname, Phone, Loc) 
现在 有 三 个 用 户 Ui ,Us 和 Us 。 使 用 SQL 的 授权 语句 实现 下 列 要 求 。 
(1) Ui 只 能 读 Emp 关系 中 除了 Salary 以 外 的 所 有 属性 。 
(2) Us 可 以 读 、 增 、 删 Dept 关系 ,并 可 以 修改 此 关系 的 Phone 属性 。 
(3) Us 可 以 读 、 增 Dept 关系 ,并 可 将 这 些 权 限 转 授 给 其 他 用 户 。 
(4) 所 有 用 户 可 以 读 Dept 关系 。 
6.13 什么 是 角色 ? 请 针对 6. 2 题目 对 Dept 可 以 读 、 增 、 删 权限 建立 一 个 角色 ,并 将 这 
些 权限 授予 用 户 Ui 、U。 和 Us 。 
6.14 在 6.2 题 目的 Emp 和 Dept 关系 上 建立 一 个 视图 : 


SeniorEmp( Sname, Sage, Salary, Dname) 


其 中 ,Sage 二 50。 并 授予 Us 用 户 可 以 读 该 视图 的 权限 。 请 用 SQL 实现 上 述 要 求 。 
6.15 请 用 SQL 语句 创建 题目 6.2 中 Emp 和 Dept 的 关系 ,并 有 以 下 约束 。 
(1) Emp 的 主键 是 Deptno,Emp 的 主键 是 Eno。 

(2) Emp 的 外 键 是 Deptno, 被 参考 的 关系 是 Dept。 
(3) Emp 的 Eage 取 值 在 20 一 60 之 间 。 


(4) Dept 的 Dname 是 唯一 的 并 且 非 空 。 

(5) Emp 的 Salary 二 1000。 

6.16 在 题目 6.2 中 定义 的 Emp 和 Emp 关系 中 ,试用 触发 器 表示 下 列 完整 性 约束 。 
(1) 20<Eage<60; 

(2) 1000 Salary<10000; 

(3) 当 插 入 或 者 修改 一 个 职工 记录 的 时 候 , 如 果 工 资 低 于 1000 元 则 自动 改 为 1000 元 。 
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7.1 MySQL 简介 


MySQL 是 目前 最 流行 的 关系 型 数据 库 管 理 系统 之 一 ,由 瑞典 MySQL AB 公司 开发 ， 
目前 属于 Oracle 旗下 产品 。 在 Web 应 用 方面 , MySQL 是 最 好 的 RDBMS (Relational 
Database Management System ,关系 数据 库 管 理 系统 ) 应 用 软件 之 一 。MySQL 也 是 一 种 关 
联 数据 库 管理 系统 ,关联 数据 库 将 数据 保存 在 不 同 的 表 中 ,而 不 是 将 所 有 数据 放 在 一 个 大 仓 
库 内 , 表 之 间 通 过 外 键 建立 关联 ,这 样 就 增加 了 速度 并 提高 了 灵活 性 。MySQL 使 用 最 常用 
的 标准 化 SQL 访问 数据 库 。 由 于 其 社区 版 的 性 能 卓越 ,搭配 PHP 和 Apache 即 可 组 建 良 
好 的 开发 环境 。MySQL 软件 体积 小 、. 运 行 速度 快 ,总 体 拥有 成 本 低 ,特别 是 开放 源码 这 一 
特点 ,一 般 中 小 型 Web 应 用 程序 的 开发 都 选择 MySQL 作为 支撑 数据 库 。 


7.2 MySQL 的 体系 结构 


MySQL 采用 的 是 客户 端 /服务 器 (Client/Server) 体 系 结构 ,因此 ,在 使 用 MySQL 存 取 
数据 时 ,必须 至 少 使 用 如 下 两 个 或 者 两 类 程序 。 

(1) 一 个 是 在 数据 服务 器 上 的 数据 库 服务 程序 (对 应 Server) 。 数 据 库 服务 程序 监听 从 
网 络 上 传 过 来 的 客户 端 请 求 并 根据 这 些 请 求 访 问 数据 库 , 将 其 结果 返回 给 客户 端 以 响应 它 
们 的 请 求 。 

(2) 连接 到 数据 库 服务 器 的 客户 端 程序 (对 应 Client) ,这 些 程序 是 用 户 和 服务 器 交互 
的 工具 ,负责 将 用 户 需 求 进行 加 工 并 传递 到 服务 器 以 及 将 服务 器 返回 的 信息 告知 用 户 。 

MySQL 的 分 发 包 由 服务 器 和 几 个 客户 端 程序 组 成 。 程 序 员 可 以 根据 具体 的 需求 来 选 
择 使 用 客户 端 。 最 常用 的 客户 端 程序 为 mysql, 这 是 一 个 交互 式 的 客户 端 程序 , 它 能 发 布 查 
询 并 看 到 结果 。 此 外 ,其 他 的 客户 端 程序 还 有 mysqldump 和 mysqlimport ,分别 导出 表 的 内 
容 到 某 个 文件 或 将 文件 的 内 容 导 入 某 个 表 ; mysqladmin 用 来 查看 服务 器 的 状态 并 完成 管 
理 任务 ,如 告诉 服务 器 关闭 、 重 启 服 务 器 、 刷 新 缓存 等 。 如 果 现 有 的 客户 端 程序 不 满足 需要 ， 
MySQL 还 提供 了 一 个 客户 端 开发 库 , 可 以 编写 自己 的 程序 。 开 发 人 员 可 以 直接 调用 开发 
库 中 的 C 程序 ,如 果 和 希望 使 用 其 他 语言 .还 有 几 种 其 他 的 接口 可 用 。 

MySQL 的 客户 端 /服务 器 体系 结构 具有 如 下 优点 。 

(1) 服务 器 提供 并 发 控制 ,使 两 个 用 户 不 能 同时 修改 相同 的 记录 。 所 有 客户 机 的 请 求 
都 通过 服务 器 处 理 , 服 务 器 分 类 辨别 谁 准 备 做 什么 , 何 时 做 。 如 果 多 个 客户 端 希望 同时 访问 
相同 的 表 , 它 们 不 必 经 过 裁决 和 协商 ,只 要 发 送 自己 的 请 求 给 服务 器 并 让 它 仔 细 确 定 完 成 这 


些 请 求 的 顺序 即 可 。 

(2) 不 必 在 数据 库 所 在 的 机 器 上 注册 。MySQL 可 以 非常 出 色 地 在 互联 网 上 工作 ,因此 
用 户 可 以 在 任何 位 置 运行 一 个 客户 端 程序 ,只 要 此 客户 端 程序 能 够 连接 到 网 络 上 的 服务 器 
即 可 。 当 然 不 是 任何 人 都 可 以 通过 网 络 访问 你 的 MySQL 服务 器 。MySQL 含有 一 个 灵活 
而 又 有 高 效 的 安全 系统 ,只 允许 有 权限 的 人 访问 数据 ,而 且 可 以 保证 用 户 只 能 够 做 允许 的 
事情 。 


7.3 MySQL 的 查询 语言 


MySQL 使 用 结构 化 查询 语言 (Structured Query Language, SQL ) 与 服务 器 通信 。 
MySQL 系统 使 用 的 SQL 基本 上 符合 SQL92 的 标准 ,但 其 对 SQL92 标准 既 有 扩展 ,又 有 未 
实现 的 地 方 。 


7.3.1 表 、 列 和 数据 类 型 


表 是 数据 在 一 个 MySQL 数据 库 中 的 存储 机 制 , 如 表 7-1 所 示 , 它 是 一 张 二 维 表 , 包 含 
一 组 固定 的 列 。 表 中 的 列 描述 该 表 所 表示 的 实体 的 属性 ,每 个 列 都 有 一 个 名 字 及 各 自 的 特 
性 。 列 由 两 部 分 组 成 : 数据 类 型 和 长 度 。 


表 7-1 MySQL 中 的 表 结 构 


Id Name Tel Sex 
9 Tom 62763218 M 
2 Marry 21532777 F 
3 Mike 45769021 M 
4 Jerry 3245012 M 


MySQL 常用 的 数据 类 型 有 数值 类 型 .字符 串 类 型 及 日 期 类 型 等 , 表 7-2 中 给 出 了 
MySQL 的 基本 数据 类 型 及 其 描述 。 


表 7-2 常用 的 数据 类 型 


数据 类 型 描 述 字 节 
SMALLINT 整数 ,从 一 32 000 到 十 32 000 2 
INT 整数 ,从 一 2 000 000 000 到 十 2 000 000 000 4 
BIGINT 不 能 用 SMALLINT 或 INT 描述 的 超大 整数 8 
FLOAT 单 精 度 浮 点 型 数据 4 
DOUBLE 双 精 度 浮 点 型 数据 8 
DECIMAL 用 户 自 定义 精度 的 浮 点 型 数据 取决 于 精度 与 长 度 
CHAR 固定 长 度 的 字符 串 特定 字符 串 长 度 
VARCHAR 具有 最 大 限制 的 可 变 长 度 的 字符 串 长 度 高 达 255 字符 
TEXT 没有 最 大 长 度 限制 的 可 变 长 度 的 字符 串 
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续 表 
数据 类 型 描 述 3 融 

BLOB 二 进 制 字符 串 

DATE yyyy-mm-dd 格式 的 日 期 3 

TIME hh:mm:ss 格式 的 时 间 3 

DATETIME 以 yyyy-mm-ddhh:mm:ss 格式 结合 日 期 和 时 间 8 

TIMESTAMP 以 yyyy-mm-ddhh:mm:ss 格式 结合 日 期 和 时 间 4 

YEAR yyyy 格式 的 年 份 是 

ENUM 一 组 数据 ,用 户 可 从 中 选择 其 中 一 个 1 或 2 个 字 节 

7.3.2 函数 


函数 (Function) 是 存储 在 数据 库 中 的 代码 块 。 程 序 员 可 以 根据 需要 创建 不 同 的 函数 ， 
并 直接 在 SQL 语句 中 调用 。 函 数 可 以 把 计算 结果 直接 返回 给 调用 的 SQL。 例 如 ,MySQL 
提供 一 个 SUBSTRING 函数 来 执行 字符 串 上 的 “ 取 子 串 ” 操 作 , 如 果 创 建 一 个 叫 作 MYSUB 
的 函数 来 执行 一 个 自 定义 的 取 子 串 操 作 , 就 可 以 在 一 个 SQL 命令 中 调用 它 。 例 如 : 


select mysub("This isa test", 6, 2) 


7.3.3 SQL 语句 


SQL 是 一 种 典型 的 非 过 程 化 程序 设计 语言 。 这 种 语言 的 特点 是 : 只 指定 哪些 数据 被 操 
作 , 至 于 对 这 些 数据 要 执行 哪些 操作 ,以 及 这 些 操 作 是 如 何 执行 的 , 则 未 被 指定 。 非 过 程 化 
程序 设计 语言 的 优点 在 于 它 的 简单 易学 ,因此 SQL 已 经 成 为 关系 数据 库 访问 和 操作 数据 的 
标准 语言 。 

与 SQL 对 应 的 是 过 程 化 程序 设计 语言 ,各 种 高 级 程序 设计 语言 都 属于 这 一 范畴 。 该 语 
言 的 特点 是 : 一 条 语句 的 执行 是 与 其 前 后 的 语句 和 控制 结构 (如 条 件 语句 、 循 环 语句 等 ) 相 
关 的 。 与 SQL 相 比 ,这 些 语言 显得 比较 复杂 ,但 优点 是 使 用 灵活 ,数据 操作 能 力 非常 强大 。 

这 些 过 程 化 的 设计 语言 不 允许 按照 某 种 特定 的 顺序 来 读 取 记 录 , 因 为 这 样 做 会 降低 
DBMS 读 取 记 录 的 效率 。 而 使 用 SQL 只 能 按 查 询 条 件 来 读 取 记录 。 当 考虑 如 何 从 表 中 取 
出 记录 时 ,自然 会 想到 按 记录 的 位 置 读 取 它 们 。 例 如 ,也 可 以 通过 循环 逐个 记录 地 扫描 ,来 
选 出 特定 的 记录 。 但 在 使 用 SQL 读 取 记录 时 ,要 尽量 避免 这 种 思路 。 

假如 想 选 出 所 有 名 字 是 “Tom” 的 记录 ,如 果 使 用 传统 的 编程 语言 ,可 能 会 构造 一 个 循 
环 ,逐个 查找 表 中 的 记录 ,看 名 字 字 段 内 容 是 否 匹 配 *“Tom”。 这 种 选择 记录 的 方法 是 可 行 
的 ,但 是 效率 非常 低 。 而 使 用 SQL 时 ,只 要 说 :“ 选 择 所 有 名 字 域 等 于 Tom 的 记录 ”,SQL 
就 会 筛选 出 所 有 符合 条 件 的 记录 。SQL 会 确定 实现 查询 的 最 佳 方法 。 

例如 ,从 表 teachers 中 取出 id 为 1 的 数据 : 


select * from teachers where id=1 


实现 相同 的 功能 ,如 果 用 普通 的 高 级 语言 ,也许 需要 一 个 复杂 的 循环 。 


7.4 MySQL 数据 库 的 安装 
(1) MySQL 数据 库 的 安装 文件 可 以 从 其 官方 网 站 下 载 (https://www. mysql. com/)， 
如 图 7-1 所 示 。 
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New! MySQL 8.0 


Up to 2x Faster than MySQL 5.7! 


图 7-1 MySQL 数据 官方 网 站 


(2) 在 MySQL 主页 的 界面 中 , 单 击 DOWNLOADS 模块 ,可 以 看 到 在 下 载 页 面 中 
MySQL 主要 有 4 种 授权 类 型 : Oracle MySQL Cloud Service,MySQL Enterprise Edition， 
MySQL Cluster CGE 以 及 MySQL Community Edition。 其 中 前 面 三 种 为 商业 版 ,需要 购 
买 才能 获得 授权 。 而 Community Edition 为 免费 版 ,需要 用 户 在 GPLCGNU General Public 
License, 通 用 公共 授权 许可 ) 的 协议 下 使 用 。 在 本 章 中 ,推荐 读者 下 载 MySQL 社区 版 服务 
器 , 即 MySQL Community Server( 截 至 2018 年 8 月 ,最 新 版 本 为 8. 0. 12 版 ) ,值得 注意 的 
是 ,最 新 版 8. 0 版 需要 Python 3.6 的 支持 。MySQL 的 下 载 链接 如 图 7-2 所 示 。 


A 
MySQL 


MySQL Community Downloads 


MySQL Community Server 


图 7-2 MySQL 社区 版 下 载 链 接 


用 户 下 载 MySQL. 既 可 选择 当前 最 新 版 本 ,也 可 以 选择 历史 版 本 。 选 择 最 新 版 本 的 优 
点 是 能 体验 最 新 的 技术 带 来 的 用 户 体验 ,但 也 可 能 存在 稳定 性 不 佳 ,对 历史 版 本 的 兼容 性 
差 , 新 技术 掌握 难度 高 ,对 环境 配置 要 求 高 等 棘 端 。 而 选择 历史 版 本 恰恰 相反 。 历 史 版 的 下 
载 链接 如 图 7-3 所 示 。 

MySQL Community Edition 为 Windows 平 台 下 的 安装 提供 了 MSI 的 安装 包 和 ZIP 格 
式 解 压 包 , 用 户 可 根据 需要 自行 选择 。 用 户 在 下 载 前 要 确认 MySQL 运行 的 操作 系统 以 及 


圩 沁 沂 


MySQL 数据 亩 扎 作 


数据 库 原 理 与 应 用 (MySQL 版 ) 


wa 
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7-3 MySQL 社区 版 的 历史 版 本 下 载 链接 


操作 系统 的 位 数 ,以 便 选 择 最 匹配 的 MySQL 软件 。 在 ZIP 格式 的 自 解压 安装 包 中 ， 
MySQL 还 提供 了 正式 版 和 调试 版 供用 户 选择 下 载 。 下 载 界面 如 图 7-4 所 示 。 
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图 7-4 MySQL 社区 版 的 历史 版 本 下 载 链接 


需要 提醒 的 是 ,在 下 载 页 面 中 ,用 户 可 以 选择 注册 或 登录 系统 进行 下 载 ,也 可 以 直接 下 
载 ,只 需要 单 击 页 面 最 下 方 的 No thanks, just start my download 即 可 。 

MySQL 的 MSI 安装 文件 运行 后 ,按照 提示 一 步 一 步 安装 即 可 ,在 安装 的 第 二 步 选 择 安装 
类 型 时 保持 默认 ,选择 第 一 个 Developer Default 即 可 ,这 里 包含 开发 者 所 需要 的 必 备 组 件 。 

在 第 三 步 ,MySQL 安装 需要 Python 3. 6 版 本 的 支持 ( 仅 依赖 Python 3. 6 版 本 , 非 其 他 
版 本 ) 。 如 果 安 装 依赖 环境 齐全 , 则 可 以 进入 安装 阶段 。 图 7-5 给 出 MySQL 社区 版 的 安装 
界面 。 这 个 过 程 需要 持续 一 段 时 间 ( 提 示 : 安装 过 程 中 最 好 暂时 中 止 或 关闭 相关 病毒 查 杀 
软件 ,以 免 存在 误 判 或 误杀 而 导致 安装 不 成 功 )。 
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Produd Status Progress 


MySQL Server 8012 Complete 


MysQL Workbench 80.12 Complete 


MySQL for Visual Studio 128 Installing 93% 


MySQL Shell B012 Ready to Install 


MySQL Router 8012 Ready to Install 
Connector/ODBC 8012 Ready to Install 


Comnector/C++ 8012 Ready to Install 


Comnector/ 8012 Resdy to lnstall 


Connector/NET 8012 Ready to Install 


Connector/Python B6 8012 Ready to Install 


MysQL Documentation 80.12 Ready to Install 


Samples and Examples 8012 Ready to Install 
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图 7-5 MySQL 社区 版 安装 进程 


安装 完成 后 ,就 进入 MySQL 的 配置 界面 ,如 图 7-6 所 示 。 相 关 配 置 工作 ,包括 Group 


Replication ,Type and Networking, Authentication Method, Account and Roles, Windows 


Service 等 配置 项 均 在 该 配置 页 进行 配置 。 


Group Replication 


图 Standalone MySQL Server / Classic MySQL Replication 


Choose this option ff you want to run the MySQL Server either standalone with the opportunity 


to later configure classic MySQL Replication, 


Using this option you can manually configure your replication setup and provide your own high 


availability solution if required. 


© Sandbox InnoDB Cluster Setup (for testing only) 
The InnoDB cluster technology provides an out-of-the-box HA (high availability) 
solution for MySQL using Group Replication technology, 


This option allows you to test an InnoDB cluster setup on your local computer 
using several MySQL Server sandbox instances. Read more about this here 


To setup a real-world production InnoDB cluster please choose the standard 


MySQL Server configuration instead on all desired hosts and use the MySQL Shell 
afterwards to create or expand the InnoDB cluster setup. 
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图 7-6 MySQL 配置 界面 
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相关 的 配置 工作 非常 重要 ,直接 关系 到 MySQL 是 否 能 行 。 因 此 ,在 配置 之 前 
- 定 要 仔细 阅读 相关 配置 项 及 其 含义 。 但 MySQL 安装 文件 保留 了 开发 者 必 备 的 基本 配 
置 ,因此 ,读者 只 需 按 照 步骤 一 步 一 步 配置 即 可 。 安 装 完成 后 ,系统 会 自动 运行 mysqlsh. 
exe 供用 户 进行 测试 使 用 ,如 图 7-7 所 示 。 


| CAprogram Files\MySQL\MysQL She O\Bin\mysalshexe 本 和 cle) 
MySQL Shell 8.0.12 

Copyright (c) 2816, 2818, Oracle and/or its affiliates. All rights reserved. 
Oracle is a registered trademark of 0racle Corporation and/or its 
affiliates. 0ther names may be trademarks of their respective 

owners . 


Type '\help’ or '\?’ for help; '\quit’ to exit . 


MySQL JS> 


图 7-7 MySQL Shell 脚本 执行 工具 


安 E 成 之 后 ,用 户 可 以 通过 MySQL 8.0 Command Line Client-Unicode. exe 来 执行 
相关 的 命令 。 接 下 来 ,就 带领 读者 一 起 用 MySQL 8. 0 Command Line Client 来 操作 
MySQL 数据 库 
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7.5 MySQL 数据 库 的 基本 操作 


7.5.1 数据 库 操作 


(1) 登录 MySQL 数据 库 : mysql -h 127.0. 0.1 -u root -p。 其 中 ,127. 0.0.1 为 数据 库 
所 在 的 主机 地 址 。 

(2) 创建 数据 库 : create database 数据 库 名 ;。 

(3) 显示 已 经 存在 的 数据 库 : show databases; 。 

(4) 删除 数据 库 : drop database 数据 库 名 ; 

(5) 查看 MySQL 数据 库 支持 的 存储 引擎 类 型 : show engines; 。 

(6) 查询 MySQL 数据 库 支 持 的 存储 引擎 : show variables like 'have%0 '; 


(7) 查询 默认 存储 引擎 : show variables like 'storage_engine ' ; 。 


7.5.2 数据 库 表 的 操作 


1. 创建 表 
创建 表 之 前 需要 用 “use 数据 库 名 ”来 选择 当前 操作 的 数据 库 。 


create table 表 名 (属性 名 数据 类 型 [完整 性 约束 条 件 ], 
属性 名 数据 类 型 [完整 性 约束 条 件 ], 


属性 名 数据 类 型 [完整 性 约束 条 件 ]); 
创建 表 的 时 候 创建 索引 : 


create table 表 名 (属性 名 数据 类 型 [完整 性 约束 条 件 ], 
属性 名 数据 类 型 [完整 性 约束 条 件 ], 


属性 名 数据 类 型 [完整 性 约束 条 件 ]， 
[unique|fulltext | spatial] index|key 
[别名 ]( 属 性 名 1[( 长 度 )] [asc|desc]) 


其 中 ， 

unique: 表示 索引 为 唯一 性 索引 。 

fulltext: 表示 索引 为 全 文 索引 。 

spatial: 表示 索引 为 空间 索引 。 

index 和 key 用 来 指定 字段 为 索引 。 

别名 : 用 来 创建 索引 取 的 新 名 称 。 

属性 名 1: 指定 索引 对 应 的 字段 的 名 称 ,该 字段 必须 是 前 面 定 义 好 的 字段 。 

长 度 : 指 索引 的 长 度 , 必 须 是 字符 串 类 型 才 可 以 使 用 。 

asc: 表示 升序 排列 。 

desc: 表示 降序 排列 。 

【 例 7-1】 假定 需要 在 学 生 数 据 库 (StudentDB) 中 创建 一 张 学 生 表 , 要 求 包括 学 生 的 标 
识 信息 (id, 自 增 ), 学 号 (code, varchar(10), 主 键 ), 姓 名 (name,varchar(20), 非 空 ), 性 
别 (sex,varchar(2)) ,出 生日 期 (birth,date) ,所 在 学 院 (school, varchar(20) , 非 空 ) ,所 在 班 
级 (class,varchar(10) , 非 空 ) ,户籍 所 在 地 (location, varchar(16) , 非 空 ), 入 学 成 绩 (score， 
float, 非 空 ,默认 值 为 0) 。 

create table student(id int not null auto_increment primary key, 

code varchar(10) not null, 
name varchar(20) not null, 
sex varchar(2), 

birth date, 

school varchar(20) not null, 
class varchar(10) not null, 
location varchar(16) not null, 


score float not null default 0.0, 
unique index codeidx (code asc) 
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查看 索引 是 否 被 使 用 : 

explain select * from 表 名 where 索 引 名 ; 

创建 空间 索引 : 

spatial index 索引 名 (属性 名 ); 

在 已 经 存在 的 表 上 创建 索引 : 

create [unique|fulltext | sratial] index 索引 名 on 表 名 (属性 名 [ (长度) ][asc|desc]); 
在 已 经 存在 的 表 上 ,用 alter table 语句 来 创建 索引 : 

alter table 表 名 add [unique|fulltext |spatial] index 索引 名 (属性 名 [ (长 度 )] [asc|desc]); 
删除 索引 : 

drop index 索 引 名 on 表 名 ; 

2. 查看 表 的 基本 定义 

describe 表 名 ;(describe 可 以 缩写 成 desc, 请 注意 与 降序 排列 的 关键 字 desc 相 区 别 ) 
【 例 7-2】 通过 describe student; 指令 ,可 以 返回 student 的 表 结 构 。 


mysql> describe student; 


+---------- +------------- +------+-----+--------- +---------------- + 
| Field | Type | Null | Key | Default | Extra 1 
i 人 4 一 一 一 i + 
lid | int(11) | NO | PRI | NULL | auto_increment | 
| code | varchar(10) | NO | UNI | NULL | | 
| name | varchar(20) | NO | | NULL | | 
| sex | varchar(2) | YES | | NULL | | 
| birth | date | YES | | NULL | | 
| school | varchar(20) | No | | NULL | | 
| class | varchar(10) | No | | NULL | | 
| location | varchar(16) | NO | | NULL | | 
| score | flo: lno | 10 | | 
全 ns 4------ +----- 4--------- +---------------- + 
9 rows in set (0.00 sec) 


3. 查看 表 默 认 的 存储 引擎 和 字符 编码 

show create table 表 名 ; 

【 例 7-3】〗 用 户 可 以 自行 通过 show create table student; 指令 ,查看 创建 的 表 结 构 ,并 与 
describe 指令 结果 进行 对 比 。 

4. 修改 表 名 

alter table 旧 表 名 rename [to] 新 表 名 ; 

5. 修改 字段 的 数据 类 型 

alter table 表 名 modify 属性 名 数据 类 型 ; 

修改 字段 名 (也 可 以 同时 修改 字段 名 和 字段 数据 类 型 ) : 

alter table 表 名 change 旧 属 性 名 新 属性 名 新 数据 类 型 ; 


6. 增加 字段 
alter table 表 名 add 属性 名 1 数据 类 型 [完整 性 约束 条 件 ] [first|after 属性 名 2](first 


的 作用 是 将 新 增加 字段 设置 为 表 的 第 一 个 字段 ,after 属性 名 2 的 作用 是 将 新 增 的 字段 添加 到 
属性 名 2 所 指 的 字段 之 后 ,如 果 没 有 上 面 两 个 参数 , 则 新 增 的 字段 默认 为 表 的 最 后 一 个 字段 。) 

【 例 7-4】 如 果 需 要 为 student 表 增 加 一 列 电话 号 码 (TelephoneNum,varchar(11)), 则 
可 以 执行 语句 : 

alter table student add TelephoneNum varchar(11); 

执行 完成 后 ,可 以 通过 describe 指令 查看 表 结 构 的 变化 。 

7. 删除 字段 

alter table 表 名 drop 属性 名 ; 

8. 修改 字段 的 排列 位 置 

alter table 表 名 modify 属性 名 1 数据 类 型 first|after 属性 名 2; 

9. 更 改 表 的 存储 引擎 

alter table 表 名 engine = 存储 引擎 名 ; 

10. 删除 表 的 外 键 约束 

alter table 表 名 drop foreign key 外 键 别名 ; 

11. 删除 没有 被 关联 的 普通 表 


drop table 表 名 ; 


7.5.3 数据 库 视图 操作 


1. 创建 视图 

在 MySQL 中 ,创建 视图 的 完整 语法 如 下 。 

CREATE [OR REPLACE] [ALGORITHM = {UNDEFINED|MERGE|TEMPTABLE)}] 

VIEW view name [(column list)] 

RS select_ statement 

[WITH [CASCADED| LOCAL] CHECK OPTION] 

其 对 应 的 语法 变量 信息 如 下 。 

LOR REPLACE] 中 括号 内 的 OR REPLACE 关键 字 是 可 选 的 。 如 果 当 前 数据 库 中 已 经 
存在 指定 名 称 的 视图 时 ,没有 该 关键 字 ,将 会 提示 错误 信息 ; 如 果 使 用 了 OR REPLACE 关 
键 字 , 则 当前 正在 创建 的 视图 会 覆盖 原来 同名 的 视图 。 

LALGORITHM 二 {UNDEFINED |MERGE |TEMPTABLE)]: ALGORITHM 子 句 是 
可 选 的 , 它 表 示 使 用 何 种 算法 来 处 理 视 图 。 此 外 , 它 并 不 属于 标准 SQL 的 一 部 分 ,而 是 
MySQL 对 标准 SQL 进行 的 功能 扩展 。ALGORITHM 可 以 设置 三 个 值 : MERGE、 
TEMPTABLE 或 UNDEFINED。 如 果 没 有 ALGORITHM 子 句 , 则 默认 值 为 UNDEFINED( 未 
定义 的 )。 对 于 MERGE ,会 将 引用 视图 的 语句 的 文本 与 视图 定义 合并 起 来 ,使 得 视图 定义 
的 某 一 部 分 取代 语句 的 对 应 部 分 。 

TEMPTABLE: 视图 的 结果 将 被 置 于 临时 表 中 ,然后 使 用 它 执行 语句 。 
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UNDEFINED: MySQL 将 选择 所 要 使 用 的 算法 。 如 果 可 能 , 它 倾向 于 MERGE 而 不 是 
TEMPTABLE, 这 是 因为 MERGE 通常 更 有 效 , 而 且 如 果 使 用 了 临时 表 , 视 图 是 不 可 更 新 
9, 之 所 以 提供 TEMPTABLE 选项 ,是 因为 TEMPTABLE 在 创建 临时 表 之 后 并 在 完成 

语句 处 理 之 前 ,能 够 释放 基 表 上 的 锁定 。 与 MERGE 算法 相 比 ,锁定 释放 的 速度 更 快 ,这 
样 ,使 用 视图 的 其 他 客户 端 不 会 被 屏蔽 过 长 时 间 。 此 外 ,MERGE 算法 要 求 视图 中 的 行 和 基 
表 中 的 行 具有 一 对 一 的 关系 。 如 果 视 图 包含 聚合 函数 (SUMG), MINO, MAX(),COUNT() 
等 ) DISTINCT .GROUP BY、HAVING、UNION 或 UNION ALL 没有 基 表 的 引用 文字 
值 (例如 : SELECT 'hello ';) 等 结构 中 的 任何 一 种 ,将 失去 一 对 一 的 关系 ,此 时 必须 使 用 临 
时 表 取 而 代 之 。 

[Cecolumn_list)]: (column_list) 用 于 自 定义 视图 中 各 个 字段 的 名 称 。 如 果 没 有 该 命令 
选项 ,那么 通过 视图 查询 到 的 各 个 字段 的 名 称 和 视图 所 使 用 到 的 数据 表 的 字段 名 称 保持 一 
致 。 下 面 是 一 个 常见 的 用 于 创建 视图 的 SQL 语句 : 

CREATE OR REPLACE VIEW v_user 

RS 

SELECT id, username FROM user; 

由 于 user 表 中 的 字段 名 称 为 id 和 username, 因 此 视图 v_user 中 的 两 个 字段 名 称 也 分 
别 默 认为 id 和 username。 现 在 ,将 视图 v_user 中 的 字段 名 称 分 别 自 定义 为 uid 和 uname。 


CREATE OR REPLACE VIEW v_user (uid, name) 

RS 

SELECT id, username FROM user; 

select statement 

select_statement 用 于 指定 视图 的 内 容 定 义 。 简 而 言 之 ,这 里 就 是 用 户 自 定义 的 一 个 
SELECT 语句 。 

[WITH [CASCADED |LOCAL] CHECK OPTION]: 该 选项 中 的 CASCADED 为 默认 
值 ,LOCAL CHECK OPTION 用 于 在 可 更 新 视图 中 防止 插入 或 更 新 行 。 

2. 删除 视图 

在 MySQL 中 删除 视图 的 方法 非常 简单 ,其 详细 语法 如 下 : 


DROP VIEW [IF EXISTS] view name [, view name2]. 


其 中 ,关键 字 IF EXISTS 用 于 防止 因 视 图 不 存在 而 提示 出 错 , 此 时 ,只 有 存在 该 视图 才 会 执 
行 删 除 操作 。DROP VIEW 语句 可 以 一 次 性 删除 多 个 视图 ,只 需要 在 多 个 视图 名 称 之 间 以 
英文 逗号 隔 开 即 可 。 如 果 多 个 视图 存在 于 不 同 的 数据 库 中 ,不 同 数据 当前 数据 库 的 视图 名 
称 之 前 还 必须 加 上 db_name. 前 缀 。 

3. 修改 视图 

请 参考 创建 视图 语法 中 的 OR REPLACE 关键 字 , 只 要 具备 该 关键 字 的 视图 创建 语句 
就 是 修改 视图 的 SQL 语句 。 

4. 查看 视图 

在 MySQL 中 ,show tables 不 仅 可 以 用 于 查看 当前 数据 库 中 存在 哪些 数据 表 , 同 时 也 


可 以 查看 到 当前 数据 库 中 存在 哪些 视图 。 

不 过 , 仅 使 用 show tables 语句 ,在 输出 结果 中 根本 无 法 区 分 到 底 哪些 才 是 视图 ,哪些 才 
是 真实 的 数据 表 ( 当 然 ,视图 的 命名 可 以 统一 约定 以 “v_” 开 头 )。 此 时 ,需要 使 用 命令 show 
full tables, 该 命令 可 以 列 出 额外 的 table_type 列 , 如 果 对 应 输出 行 上 该 列 的 值 为 “VIEW”， 
则 表示 这 是 一 个 视图 。 

当 通 过 上 述 命令 找到 所 需要 的 视图 之 后 ,可 以 使 用 如 下 命令 查看 创建 该 视图 的 详细 语句 : 

Show create view view_ name 

【 例 7-5】 如 果 需 要 一 个 视图 仅 查看 student 表 的 标识 、 学 号 、 姓 名、 电话 这 4 列 , 则 可 
以 创建 一 个 视图 。 假 设 定义 该 视图 名 称 为 v_student, 则 可 以 通过 下 列 SQL 请 句 实现 视图 
创建 操作 。 

CREATE VIEW v_student 

RS 

SELECT id, code, name, TelephoneNum FROM student; 

执行 完 以 后 可 以 通过 show create view v_student; 来 查看 创建 该 视图 的 详细 语句 。 也 可 
以 通过 describe v_student; 来 查看 视图 的 结构 ,例如 : 


mysql> describe sn 


--------------+------------- 二 一 一 一 一 一 一 十 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 一 一 -十 
i Field i Type | Null | Key | Default | Extra | 
-------------- +--------~-----+------+-----4---------+------- 
i id | int(11) lno | 10 1 | 
| Ege | varchar(10) | NO | | NULL 1 | 

| varchar(20) | NO | | NULL 1 | 
| TeTephonehum varchar(11) | YES | | NULL 1 | 
--------------+-------------+------ +-----+---------+-------+ 


i rows in set 站 00 sec) 


7.5.4 数据 操作 语言 


SELECT 是 SQL 中 最 常用 的 语句 ,而 且 怎样 使 用 它 也 最 为 讲究 ; 用 它 来 选择 记录 可 能 
相当 复杂 ,可 能 会 涉及 许多 表 中 列 之 间 的 比较 。 本 节 介 绍 Select 语句 关于 查询 的 最 基本 功能 。 

SELECT 语句 的 语法 如 下 。 

SELECT selection list 

selection_list 为 要 选择 的 列 ,多 个 列 名 之 间 用 英文 逗号 隔 开 。 

FROM table_list 

table_list 为 表 名 列表 ,多 个 表 之 间 用 英文 逗号 阳 开 。 如 果 不 同 表 的 相同 列 名 需要 加 以 区 分 。 

WHERE primary_constraint 

primary_constraint 为 条 件 表达 语句 ,表明 查询 的 记录 必须 满足 什么 条 件 。 

GROUP BY grouping_columns 

grouping_columns 表示 分 组 列 , 多 个 分 组 列 之 间 用 英文 逗号 隔 开 。 


HAVING secondary constraint 
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secondary_constraint 表示 查询 记录 必须 满足 的 第 二 条 件 


ORDER BY sorting columns 


sorting_columns 表示 排序 列 , 多 个 排序 列 中 间 需 要 用 英文 逗号 隔 开 。 


LIMIT count 


LIMIT 子 句 可 以 被 用 于 强制 SELECT 语句 返回 指定 的 记录 数 。count 可 以 为 一 个 或 
两 个 数字 参数 。 参 数 必 须 是 一 个 整数 常量 。 如 果 给 定 两 个 参数 ,第 一 个 参数 指定 第 一 
回 记 录 行 的 偏 移 量 , 第 二 个 参数 指定 返回 记录 行 的 最 大 数目 。 

注意 : 所 有 使 用 的 关键 词 必须 精确 地 按照 上 面 的 顺序 给 出 。 例 如 ,一 个 HAVING 子 句 
必须 跟 在 GROUP BY 子 句 之 后 和 ORDER BY 子 句 之 前 。 

下 面 的 实例 通过 对 student( 学 生 信 息 表 ) 和 class_table( 学 生 课 程 成 绩 信 息 表 ) 的 实际 


操作 来 介绍 。 其 中 ,student 表 的 记录 如 下 。 


Wsql> select * from student; 


上 -十 -一 -二 -一 + 一 -一 二 -一 


| id | code | name | sex | birth 

上 一 一 -一 -一 十 一 一 一 一 一 一 一 
23 | 08133192 水 时 1985-10-01 | 
24 | 08133193 伟 1986-10-01 
25 | 08133194 女 1986-09-01 
26 | 08133195 外 1986-08-01 
27 | 08133196 1985-08-01 
28 | 08133197 易 1985-11-01 
29 | 08133198 0 如 1985-12-12 
30 | 08133199 1985-01-12 
31 | 081331910 | 1985-08-12 


class_table 表 的 记录 如 下 。 


wal select * 党 本 class_ 二 


08133192 下 
24 | 08133192 飞 
25 | 08133192 EE 
26 | 081331910 
27 | 081331910 | 玉 
28 | 081331910 | 玉 
29 | 08133193 大 
30 | 08133193 大 
31 | 08133193 大 
32 | 08133198 | 宁 / 
33 | 08133198 | 宋 , 
34 | 08133198 急 \ 傅 
35 | 081331910 
36 | 081331910 | 王 i 
37 | 081331910 | 于 
38 | 081331910 | 王 
39 | 081331910 | 玉 
40 | 081331910 | 玉 
41 | 081331910 | 玉 
42 | 081331910 | 王 i 
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1. 普通 查询 


Select 最 简单 的 用 途 是 找 出 某 张 表 中 的 所 有 数据 。 


【 例 7-6】 查询 学 生 表 中 的 所 有 信息 。 


mysql > Select * from student; 


其 中 ,“x* ”也 可 以 为 表 中 的 所 有 字段 。 


-+ 


| birth 
本 


23 | 08133192 
24 | 08133193 
25 | 08133194 
26 | 08133195 
27 | 08133196 
28 | 08133197 
29 | 08133198 
30 | 08133199 
0 910 


1985-10-01 
1986-10-01 
1986-09-01 
1986-08-01 
1985-08-01 
1985-11-01 
1985-12-12 


1985-01-12 
198 


下 HH 


【 例 7-7】 查询 所 有 学 生 的 姓名 和 班级 。 


mysql》select name, class from student; 
-十 


出 注 尘 HH 好 二 
人 

斌 

SSS 

人 


静 2013-3 
和 +- 一 - 十 -一 -一 一 一 一 


2. 查询 特定 行 
从 表 中 只 选择 特定 的 行 。 
【 例 7-8〗 查找 姓名 为 王 静 的 学 生 情 况 。 


mysql> select * from student where name=’ 王 静 "; 
二 一 -一 一 一- 十 --- 一 二 -一 二- 一 一 一 一 一 二 + 一 十 一 一 一 一 -一 -- 二 -一 一 -一 


| sex | birth 


| school | class | location | score 
十 十 一 一 


学 院 


+ 
| 2013-3 | 
+ 


3. 查询 特定 列 
从 表 中 只 选择 特定 的 列 。 
【 例 7-9】 查询 学 生 姓 名 为 王 静 的 性 别 ( 查 询 结果 同时 显示 姓名 ) 。 


mysql> SELECT name, sex FRON student WHERE name=' 王 静 ” : 
十 


4. 条 件 查询 

不 必 每 次 查询 都 返回 所 有 的 行 记录 ,可 以 从 表 中 只 选择 特定 的 行 。 为 此 需要 使 用 
WHERE 或 者 HAVING 从 句 。HAVING 从 名 与 WHERE 从 句 的 区 别 是 ,HAVING 表达 
的 是 第 二 条 件 , 需 要 与 GROUP BY 从 句 配合 使 用 ,不 能 在 WHERE 子 句 中 的 项 目 使 用 
HAVING。 因 此 本 节 仅 介绍 WHERE 从 句 的 使 用 .HAVING 从 名 的 使 用 方法 类 似 。 另 
外 ,WHERE 从 句 也 可 以 实现 HAVING 从 句 的 绝 大 部 分 功能 。 

为 了 限制 SELECT 语句 检索 出 来 的 记录 集 , 可 使 用 WHERE 子 句 , 它 给 出 选择 行 的 条 
件 。 可 通过 查找 满足 各 种 条 件 的 列 值 来 选择 行 。 常 用 的 运算 符 包 括 算术 运算 符 ( 如 表 7-3 
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所 示 ) ,比较 运算 符 ( 如 表 7-4 所 示 ) ,逻辑 运算 符 ( 如 表 7-5 所 示 ) 。 


表 7-3 算术 运算 符 
运 算 符 说 明 运 算 符 说 明 
沸 加 * 乘 
= 减 / 除 
表 7-4 比较 运算 符 
运 算 符 说 明 运 算 符 说 明 
< 小 于 != 或 <> 不 等 于 
ES 小 于 等 于 = 大 于 等 于 
wm. 等 于 > 天 竹 
表 7-5 逻辑 运算 符 
运 算 符 说 明 
NOT 或 ! 逻辑 非 
OR 或 | 逻辑 或 
AND 或 &.& 逻辑 与 
【 例 7-10】 查找 性 别 为 男 并 且 分 数 大 于 528 分 的 学 生 情 况 。 
mysql> select * from student where sex=' 男 ”and score>528; 
se Tome jj 
EE | 本 | 是。 | 量 
30 | 08133199 | 宋 小 俊 时 1985-01-12 | 各 学 院 2013-2 仙 珊 和 578 
+- 一 十 一 -一 一 玫 一 一 一 下 一 一 十 一 一 一 一 一 十 -一 一 一 二 -一 一 一 一 一 一 二 一 
【 例 7-11】 查找 姓名 不 是 王 静 的 学 生 情 况 。 


where rane 


08133192 | 所 飞 男 1985-10-01 学 院 526 

24 | 08133193 Ea 男 1986-10-01 这 攻 

25 | 08133194 京 1986-09-01 尝 阮 

26 | 08133195 Ee FE 1986-08-01 册 尝 院 

27 | 08133196 | 王公 加 1985-08-01 册 尝 院 

28 | 08133197 | 王 飞 男 1985-11-01 上 寺院 

29 | 08133198 币 沪 外 1985-12-12 芋 阮 

30 | 08133199 | 宋 小 俊 1985-01-12 机 学 院 
ee “sre OAR 

【 例 7-12】 查找 分 数 大 于 等 于 545 分 的 学 生 情 况 
mysql> select * from student where score>545; 
es eee srr 

id | code name sex | birth 

i 

24 | 08133193 | 李 大 伟 田 1986-10-01 

27 | 08133196 | 王 俊 加 1985-08-01 

28 | 08133197 | 王 飞 男 1985-11-01 

29 | 08133198 来 | 准 女 1985-12-12 

30 | 08133199 | 宋 小 俊 田 1985-01-12 


【 例 7-13】 查找 姓名 为 王 静 或 者 姓名 为 李霞 的 学 生 情 况 。 


mysql> select + from student where name=’ 王 静 or name=’ 李霞 ' ; 


| sex | birth | school | class | location | score | 
met seas tech etn ene ER rata ttre a 
| 党 25 | 08133194 | 李 填 和 | 1986-09-01 | i 2013-3 | 江苏 徐州 | 525 
081331910 了 1985-08-12 2013-3 | 江苏 南通 508 

+- 一 二 -一 一 -一 -十 一 一 -一 -十 一 一 -二 一 一 一 一 -一 一 一 一 一 + 一- -+ 


5. 模糊 查询 
对 于 查询 条 件 不 明确 的 情况 下 ,可 以 使 用 like 关键 字 对 带 有 通配符 的 条 件 进行 查询 。 
常用 的 通配符 如 表 7-6 所 示 。 


表 7-6 常用 的 通配符 


通 配 符 说 明 
% 包含 零 个 或 多 个 字符 组 成 的 任意 字符 串 
_( 下 面 线 ) 任意 一 个 字符 


【 例 7-14】 查询 姓名 中 带 有 “ 李 ” 字 的 学 生 情况 。 


wsal> select * from student where name like '%% ; 
一 一 二 一 一- 一- 二 


| score | 


+ 
2013-1 


一 十 一 
‘zs 08133192 下 10-01 | 机 学 院 山 去 四 526 
24 | 08133193 | By | 1986-10-01 和 2013-2 | 山 568 
| 08133194 EE 1986- | 册 圣 院 2013-3 | 江 ; 向 525 
【 例 7-15】 查询 姓 * 李 ” 且 姓 名 为 两 个 字 的 学 生 情 况 。 
mysql> select # from student Where name like 本; 
一 -十 一 一 -二 
| score | 
男 算 机 学 院 2013- 工 | 太原 | 526 
23 | 08133192 1985-10-01 
| 25 | 08133194 | 请 | 委 1 1986-09-01 1 油 刻 2013-3 | 江苏 徐州 | 525 
0 


6. 查询 排序 
使 用 order by 子 句 对 查询 返回 的 结果 按 一 列 或 多 列 排序 。order by 子 句 的 请 法 格式 为 


ORDER BY column_name [ASC|DESC] [,…] 


其 中 ,ASC 表示 升序 ,为 默认 值 ,DESC 为 降序 。ORDER BY 不 能 按 text 和 image 数据 类 型 
进行 排序 。 另 外 ,可 以 根据 表达 式 进行 排序 。 
【 例 7-16】 按 分 数 升序 排序 。 


mysql> select * from student order by score asc; 
+ 十 十 


一 - 开 一 一 一 -二 一 一 一 一 一 二 一 一 一 
| location | score 


| 


31 | 081331910 | 斑 静 女 1985-08-12 | 计 
25 | 08133194 慎 女 1986-09-01 | 训 
23 | 08133192 ~ 男 | 1985-10-01 | 讨 
26 | 08133195 | 土 入 去 | 1986-08-01 | 计 
27 | 08133196 | 王 俊 勇 | 1985-08-01 | i 
28 | 08133197 | 王 飞 男 1985-11-01 | i 
24 | 08133193 | 李 大 ， 田 | 1986-10-01 | 了 
30 | 08133199 肘 男 | 1985-01-12 | 于 
29 | 08133198 | 宋 小 傅 女 | 1985-12-12 | 计 


| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
1 
| 
| 
| 
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【 例 7-17】 按 分 数 降序 排序 。 


vegly select * from student order by score desc; 


一 -一 一 一 一 十 -一 一 全 一 -一 一 一 一 一 -一 一 一 直 - 一 一 一 直 - 一 一 -一 一 一 下 一 -一 下 
1 id | code | name | sex | birth | “school | class | location | score | 
一 一 一 十 一 一 一 十 十 

29 | 08133198 | 宋 小 全 女 ”| 1985-12-12 | 计算 机 学 院 2013-1 | 江苏 扬州 598 

30 | 08133199 小 Ea 1985-01-12 | 计算 机 学 院 2013-2 | 江苏 南通 

24 | 08133193 另 1986-10-01 | 计 总 区 2013-2 

28 | 08133197 田 1985-11-01 | 计算 机 学 2013-4 

27 | 08133196 | 主公 男 1985-08-01 | 计算 届 学 院 2013-5 

26 | 08133195 5 女 1986-08-01 | 计 复 机 竺 院 2013-4 

23 | 08133192 男 1985-10-01 | 计算 机 学 院 2013-1 

25 | 08133194 女 1986-09-01 | 计算 机 学 院 2013-3 

31 | 081331910 女 1985-08-12 | 计算 机 学 院 2013-3 
-一 一 一 一 一 十 -一 一 一 一 一 二 一 一 一 二 -一 一 一 二 


7. 查询 分 组 与 统计 
group by 关键 字 可 以 将 查询 结果 按照 某 个 字段 或 多 个 字段 进行 分 组 。 字段 取 值 相等 
的 为 一 组 。 基 本 的 语法 格式 如 下 。 


GROUP BY 属性 名 [HAVING 条 件 表达 式 ] [WITH ROLLUP] 


属性 名 : 是 指 按照 该 字段 的 值 进行 分 组 。 

HAVING 条 件 表达 式 : 用 来 对 分 组 后 的 结果 进行 筛选 显示 ,符合 条 件 表达 式 的 分 组 将 
被 保留 。 

WITH ROLLUP: 将 会 在 所 有 记录 的 最 后 加 上 一 条 记录 。 加 上 的 这 一 条 记录 是 上 面 
所 有 记录 的 总 和 。 

GROUP BY 关键 字 可 以 和 GROUP_CONCAT () 函 数 一 起 使 用 。GROUP_CONCAT 0 〇 阴 
数 会 把 每 个 分 组 中 指定 的 字段 值 都 显示 出 来 。 

同时 ,GROUP BY 关键 字 通 常 与 集合 函数 一 起 使 用 。 集 合 函数 包括 COUNT() 函数、 
SUMO 函 数 .AVGO 〇 函数 .MAXO 〇 函数 和 MIN() 函数 等 ,具体 说 明 如 表 7-7 所 示 。 


表 7-7 集合 函数 
函 数 说 明 
COUNTO 用 于 统计 记录 的 条 数 
SUMO 用 于 计算 字段 的 值 的 总 和 
AVGO 用 于 计算 字段 的 值 的 平均 值 
MAXO) 用 于 查询 字段 的 最 大 值 
MINO 用 于 查询 字段 的 最 小 值 


如 果 GROUP BY 不 与 上 述 函 数 一 起 使 用 ,那么 查询 结果 就 是 字段 取 值 的 分 组 情况 。 
字段 中 取 值 相同 的 记录 为 一 组 ,但 是 只 显示 该 组 的 第 一 条 记录 。 
【 例 7-18】 对 学 生 表 按 班 级 分 组 。 


mysql> select * from tudent owp'b by class; 


+- 一 二 一 一 -一 一 十- 一 一 一 下 一 一 下 一 一 一 一 一 十 一 一 一 -一 一 一 -一 十 一 一 一 十 -一 一 -一 一 十 一 一 一 十 

| id | code | name 1 sex “| birth | school | class | location | score | 

+ 一 一 一 一 一 十 一 一 一 一 一 一 一 一 一 一 一 -+ 一 + 一 一 一 
23 | 08133192 1985-10-01 | 计算 机 学 院 2013-1 | 山西 太原 526 
24 | 08133193 Ear 量 1986-10-01 | 计 | 举 放 2013-2 | 山西 交口 568 
25 | 08133194 京 1986-09-01 | 计算 机 竺 院 江 劳 徐州 525 
26 | 08133195 去 1986-08-01 | 计算 机 学 院 泉 528 
27 | 08133196 男 1985-08-01 | 学 院 548 


【 例 7-19】 统计 每 班 的 学 生 姓名 。 


msql> select class, GROUP CONCAT (name) from student group by class; 
ri 
| class 六 | _GROUP CONCAT (name) | 


i | 
和 


2013-3 
2013-4 | 主 葆 ， 
2013-5 广 傣 


洲 ， i 


【 例 7-20】 统计 每 班 的 人 数 。 


msql> select class, count (+) from student group by class; 


| 一 一 
| class | count(*) | 
1 一 一 十 一 -一 一 -二 
2013-1 和 
2013-2 3 
2013-3 2 
2013-4 2 
2013-5 , 
上 一 十 -一 一 一 一 十 


【 例 7-21】 统计 每 班 的 总 分 。 


wsql> select class, sum(score) from student group by class 


eeeb fies bball et 
class | sum(score) 

| te 
2013-1 1124 
2013-2 1146 
2013-3 1033 
2013-4 1086 
2013-5 548 

+ 一 一 -一 十 一- 一 -一 一 十 


【 例 7-22】 统计 每 班 的 最 高 分 。 


Iw setaet class, max (score) from student group by class; 


hein si pies 二 
class 1 max(score) 
+- 一 十 -一 -一直 
2013-1 598 
2013-2 578 
2013-3 525 
2013-4 558 
2013-5 548 


【 例 7-23】 统计 每 班 的 总 分 , 列 出 总 分 超过 1100 分 的 班级 及 其 总 分 。 


mysql> select class, sum(score) as sum from student group by class having sum(score)>1100 


Ta 1124 | 
2013-2 a 


【 例 7-24】 统计 每 班 的 总 分 ,并 汇总 求 和 。 


mysql> select class, sum(score) as sum from student group by class with rollup; 
二 一 二 一 一 一 


| class | sm | 

+4- 一 十 ----- 十 
2013-1 | 1124 
2013-2 | 1146 
2013-3 | 1033 
2013-4 | 1086 第 
2013-5 | 548 7 
NULL | 4937 

bs 章 
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8. 多 表 查 询 

1) 内 连接 

内 连接 (inner join) 将 两 个 表 中 满足 指定 连接 条 件 的 记录 连接 成 新 的 结果 集 , 舍 弃 所 有 
不 满足 连接 条 件 的 记录 。 内 连接 是 最 常用 的 连接 类 型 ,也 是 默认 的 连接 类 型 ,可 以 在 from 
子 句 中 使 用 inner join(inner 关键 字 可 以 省 略 ) 实 现 内 连接 ,语法 格式 如 下 。 


select * from 表 1 [inner] join 表 2 on 表 1 和 表 2 之 间 的 连接 条 件 
【 例 7-25】 在 student 表 和 class_table 表 中 查询 姓名 为 王 静 的 学 生 情 况 。 


mysql> select student.*, class_table. classname class_table. score from student join class_table on student. nane=class_table. nane where student. name= 王 静 


re 


| nmme |sexr | i | class | location | scare | laosnane | score | 


| 
| 


31 | 081331910 广 学 508 8 
31 | 081331910 于 女 学 攻 508 少 理 8 
31 | 081331910 | 玉 | 女 这 攻 508 78 
31 | 081331910 | Ei 女 对 508 | mcbidi 98 
中 | 081331910 | 玉 | 女 学 | 508 | cq 程序 设计 9 
31 | 081331910 # 女 学 | 508 | ASP. net 程 序 设计 98 
31 | 081331910 女 508 六 义 

31 | 081331910 习 女 过 508 | 美 请 1 、 38 
31 | 081331910 ee 学 | 508 学 9 
31 | 081331910 | 于 | 女 508 人 98 
31 | 081331910 | 于 女 。 | 1985-08- 学 508 | 线性 98 

+ ~ -一 + 


2) 外 连接 

外 连接 又 分 为 左 连接 (left join) \ 右 连接 (right join) 和 完全 连接 (full join)。 与 内 连接 
不 同 ,外 连接 ( 左 连接 或 右 连 接 ) 的 连接 条 件 只 过 滤 一 个 表 , 对 另 一 个 表 不 进行 过 滤 ( 该 表 的 
所 有 记录 出 现在 结果 集中 )。( 注 意 : MySQL 和 暂 不 支持 完全 连接 。) 

(1) 左 连接 的 语法 格式 。 


select * from 表 1 left join 表 2 on 表 1 和 表 2 之 间 的 连接 条 件 


说 明 : 语法 格式 中 表 1 左 连接 表 2, 意 味 着 查询 结果 集中 须 包含 表 1 的 全 部 记录 ,然后 
表 1 按 指定 的 连接 条 件 与 表 2 进行 连接 , 若 表 2 中 没有 满足 连接 条 件 的 记录 , 则 结果 集中 表 
2 相应 的 字段 填 人 NULL。 

【 例 7-26〗 在 student 表 和 class_table 表 中 查询 姓名 相同 的 所 有 记录 。 


本 select student,*, c1ass_1 table, ni clase- table. score 三 过 Student left join class_table on student, name=class. table, name; 


tt Re re 


id | code Sex i birth i school class | location score | clasenane Score 
4 一 一 一 一 -一 一 二 -一 一 -一 一 一 下 + + 
23 | 08133192 水 1985-10-01 学 | 
23 | 08133192 飞 1985-10-01 学 
23 | 08133192 来 1985-10-01 学 
24 | 08133193 大 1986-10-01 学 
24 | 08133193 大 1986-10-01 学 
24 | 08133193 1986-10-01 于 
25 | 08133194 率 1986-09-01 阮 
26 | 08133195 | 主 女 | 1986-08-01 学 辽 
27 | 08133196 | 玉 呈 1985-08-01 蕊 区 
28 | 08133197 | 主 1985-11-01 到 
29 | 081335198 | 来 小 女 | 1985-12-12 用 区 
29 | 08133198 | 宋 小 女 | 1985-12-12 学 
29 | 08133198 小 女 | 1985-12-12 学 阮 
30 | 08133199 厅 \ 俊 男 | 1985-01-12 加 说 
31 | 081331910 妇 | 1985-08-12 洱 
31 | 081331910 | 主 女 | 1985-08-12 这 
31 | 081331910 | 扩 女 | 1985-08-12 学 | 
31 | 081331910 | 王 女 | 1985-08-12 年 阮 
31 | 081331910 | 王 妇 | 1985-08-12 入 区 
31 | 081331910 | 王 女 ”| 1985-08-12 
31 | 081331910 | 琅 雪 | 1985-08-12 区 
31 | 081331910 | 王 女 | 1985-08-12 
31 | 081331910 | 玉 i 妈 | 1985-08-12 年 院 
31 | 081331910 | 王 妇 | 1985-08-12 竺 区 
31 | 081331910 | 王 i 女 | 1985-08-12 了 


(2) 右 连 接 的 语法 格式 。 
select * from 表 1 right join 表 2 on 表 1 和 表 2 之 间 的 连接 条 件 


说 明 : 语法 格式 中 表 1 右 连 接 表 2, 意 味 着 查询 结果 集中 须 包 含 表 2 的 全 部 记录 ,然后 
表 2 按 指定 的 连接 条 件 与 表 1 进行 连接 , 若 表 1 中 没有 满足 连接 条 件 的 记录 , 则 结果 集中 表 
1 相应 的 字段 填 人 NULL。 

【 例 7-27】 在 student 表 和 class_table 表 中 查询 姓名 相同 的 所 有 记录 。 


mysql> select class_table.+, student.name, student. sex from class_table right join student on student.name=class_table.name; 
+ 一 一 下 一 + + 一 十 一 一 一 -一 


id | code | name | school class | classname score | name sex 
+ 一 -十 一 一 一 一 -十 -一 一 -一 一 十 -一 一 一 一 一 一 一 一 -一 一 -一 一 一 -一 一 -一 一 十 -一 -一 一 一 
23 | 08133192 | 李 飞 计算 机 学 院 2013-1 88 | 李 飞 时 
24 | 08133192 | 李 飞 计算 机 学 院 2013-1 原理 38 | 李 飞 Ea 
25 | 08133192 | 李 飞 计算 机 学 院 2013-1 理 98 | 李 飞 对 
29 | 08133193 | 李 大 计算 机 学 阮 2013-2 构 82 | 李 大 Ea 
30 | 08133193 | 李 大 - t 学 院 2013-2 六 原理 36 大 Ea 
31 | 08133193 | 李 大 计算 机 学 院 2013-2 原理 80 男 
NULL | NULL NuiL NULL NL | NULL NULL 妈 

NULL | NULL NULL NULL NULL | NULL NULL | 主 

NULL | NULL NULL NULL NULL | NULL MULL | 王 

NULL | NULL WL NULL NULL | NULL NULL 
32 | 08133198 | 宋 小 i 学 院 2013-1 蛛 轨 81 | 来 小 妇 
33 | 08133198 折 v 计算 机 学 院 2013-1 理 87 | 宋 小 Ea 
34 | 08133198 | 宋 小 学 院 2013-1 结 68 | 宋 小 路 

NULL | NULL NULL NULL NIL | NULL NULL | 来 小 
26 | 081331910 | 于 计算 机 学 院 2013-3 [3 98 | 主 女 
27 | 081331910 | 于 | 计算 机 学 院 2013-3 原理 38 | 玉 EE 
28 | 081331910 | 于 | 计算 机 竺 院 2013-3 结 78 | 于 交 
35 | 081331910 | 王 i 计算 机 学 | 2013-3 el 98 | 玉 六 
36 | 081331910 | 王 i 计算 机 学 | 2013-3 | C# 程 一 98 | 到 交 
37 | 081331910 | 主 计算 机 学 | 2013-3 | ASP. net 程 序 设计 38 | 琅 
38 | 081331910 | 主 学 | 2013-3 六 98 | 主 如 
39 | 081331910 | 于 | 计算 机 学 | 2013-3 | 闫 让 1 98 | 王 ! 
40 | 081331910 | 玉 计 复 机 学 | 2013-3 | 高 地 数学 98 | 王 Eg 
41 | 081331310 | 王 1 i 寺院 2013-3 衬 论 98 | 于 i 永 
42 | 081331910 | 主 计算 机 学 | 2013-3 | 线性 代数 8 | 王 女 

证 一 一 一 一 一- 十 


7.6 常用 开发 平台 与 MySQL 数据 的 连接 


MySQL 通过 连接 器 (Connector) 和 APICApplication Program Interface) 为 Java、C++、 
. NET、PHP、Python、C 等 语言 开发 的 客户 端 提供 访问 数据 库 的 驱动 程序 和 访问 接口 。 同 
时 ,MySQL 提供 了 ODBC、Java (JDBC) 、Perl、Ruby 等 语言 (连接 驱动 ) 的 数据 库 访 问 实例 
程序 。 本 节 重 点 介绍 Java、C# 语言 访问 MySQL 数据 库 的 过 程 。 

1. Java 语言 访问 MySQL 

使 用 Java 语言 对 MySQL 进行 访问 之 前 ,首先 要 获取 MySQL 为 Java 语言 提供 的 连接 
器 Connector for Java 8.0。MySQL 连接 器 (MySQL Connector) 是 由 . zip 或 . tar. gz 组 成 的 
压缩 包 。 压 缩 包 内 包含 实例 代码 和 JAR 文件 mysql-connector-java-version. jar。 其 中 ， 
version 是 版 本 号 ,截至 本 书 出 版 ,最 新 版 本 号 为 8.0. 13。 

以 Eclipse 为 例 ,程序 员 首 先 需要 在 项 目 工程 的 目录 下 建立 一 个 lib 文件 夹 ,然后 将 连 
接 的 JAR 文件 复制 到 lib 目录 下 。 第 二 步 ,在 Eclipse 上 右键 单 击 工程 项 目 名 称 ,在 菜单 中 
选择 Java build path 项 目 。 第 三 步 ,在 弹出 的 界面 中 选择 Libraries, 单 击 Add JARs 按钮 ， 
将 复制 进去 的 JAR 文件 加 入 到 项 目 中 。 第 四 步 ,在 需要 访问 数据 库 的 代码 中 引入 MySQL 
for Java _ Connector 的 类 库 , 如 import java. sql. Connection; ，import java. sql. 


DriverManager;, import java. sql. ResultSet; , import java. sql. SQLException;, import 


java. sql. Statement;。 最 后 就 可 以 在 代码 里 声明 数据 库 操作 的 相关 变量 ,并 对 数据 库 进 行 
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操作 了 。 


// 声 明 Connection 对 象 
Connection con; 
// 驱 动 程序 名 
String driver = "com.mysql. jdbc.Driver"; 
//URL 指向 要 访问 的 数据 库 名 ,用 户 在 访问 自己 数据 库 时 需要 更 换 下 夯 线 部 分 的 内 容 
String url = "jdbc:mysql://192.168.0.5:3306/MyDb"; 
//MySQL 设置 的 用 户 名 
String user = "root"; 
//MYSQL 设置 的 密码 
String password = " #xxxxx"; 
// 进 行 数据 库 操作 
try{ 
// 加 载 驱动 程序 
Class. forName( driver); 
// 通 过 DriverManager. getConnection() 方 法 ,对 MySQL 数据 库 进 行 连接 
con = DriverManager. getConnection(url, user, password); 
if(!con. isClosed( )) 
System. out. println(" 成 功 连接 到 数据 库 !"); 
// 创 建 statement 类 对 象 ,执行 SQL 语句 
Statement statement = con.createStatement(); 
// 要 执行 的 SQL 语句 
String sql = "select * from UserTable"; 
// 利 用 ResultSet 类 存放 结果 集 
ResultSet rs = statement.executeQuery(sql); 
// 对 ResultSet 进行 遍历 
while(rs. next()){ 
// 获 取 XX 列 的 数据 ,并 输出 
System. out. println(rs. getString("XX")); 
} 
} catch(ClassNotFoundException e) { 
// 数 据 库 驱 动 类 异常 处 理 
System. out. println(" 数 据 库 连 接 错误 "); 
e. printStackTrace( ); 
} catch( SQLException e) { 
// 数 据 库 连接 失败 异常 处 理 
e.printStackTrace( ); 
}catch (Exception e) { 
// 处 理 其 他 异常 
e. printStackTrace( ); 
}finally{ 
// 为 了 节约 数据 库 服 务 器 资源 ,使 用 完毕 后 ,务必 关闭 下 面 两 个 对 象 
rs.close(); 
con. close(); 


} 


2. .NET 平台 访问 MySQL 
使 用 C# 或 VB. NET 语言 对 MySQL 进行 访问 之 前 ,同样 要 获取 MySQL 为 这 两 种 语 


言 提供 的 连接 器 Connector for NET 8.0。MySQL 为 . NET 提供 的 连接 器 有 三 种 安装 方 
式 : MySQL Installer,Standalone Installer,NuGet。 以 Standalone Installer 为 例 , 可 以 直接 
通过 Windows Installer (. msi) 进行 安装 ,MSI 文件 名 为 mysql-connector-net-version. zip。 
其 中 ,version 是 版 本 号 ,截至 目前 ,最 新 版 本 号 为 8. 0. 13。 

下 面 以 Microsoft Visual . NET 2015 为 例 ,介绍 如 何 使 用 . NET 平台 (以 C# 语 言 和 
VB. NET 语言 为 主 ) 进 行 MySQL 数据 库 访问 。 

第 一 步 : 创建 相关 工程 项 目 。 

第 二 步 : 添加 对 MySQL Connector 的 引用 。 右 键 单 击 工程 项 目 名 称 , 选 择 “ 添 加 ” 荣 单 
项 目下 的 “引用 ” 子 项 目 。 

第 三 步 : 在 弹出 对 话 框 中 ,选择 “浏览 ”, 找 到 MySQL Connector for Net 组 件 的 安装 位 
置 ,打开 Assemblies 文件 夹 下 的 v4.0 或 v4.5 文件 夹 , 选 择 MySql. Data. dll 动态 链接 库 , 选 
择 完 成 之 后 单 击 “ 确 定 ” 按 钮 。 

第 四 步 : 在 需要 访问 MySQL 数据 库 的 页 面 中 使 用 *using MySql. Data. MySqlClient;” 
对 MySQL 数据 库 进 行 操作 。 


string url = "server = 192. 168. 0. 5: 3306; user jid = root; password = 关 关 关 兴 #X# ) database = 
MyDb; "; 
MySqlConnection con = new MySqlConnection(url); 
string statement = "select * from UserTable "; 
MySqlCommand com = new MYSqlCommand( statement，con) ; 
MySqlDataReader reader = null; 
try { 

con. Open( ); 

reader = com. ExecuteReader(); 

while (reader. Read()) { 

Console. Writeln(reader[ "XX"].ToString()); 

} 
} 
catch (Exception ex) { 

Console. WriteLine ("数据 库 访问 异常 "); 
} 
finally{ 

if(reader != null) 

reader. Close( ); 
con. Close(); 


7.7 MySQL 数据 库 的 备份 与 恢复 


本 节 介 绍 最 常用 的 MySQL 数据 库 备 份 与 恢复 方式 : mysqldump。 

1. mysqldump 备份 

mysqldump 是 采用 SQL 级 别 的 备份 机 制 , 它 将 数据 表 导 出 成 SQL 脚本 文件 ,在 不 同 的 
MySQL 版 本 之 间 升 级 时 比较 合适 ,这 也 是 最 常用 的 备份 方法 。 
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备份 方式 如 下 : 

mysqldump -hhostname - P 端口 -u 用 户 名 -密码 ( - database) 数据 库 名 > 文件 名 . sql 

备份 MySQL 数据 库 的 命令 : 

mysqldump - h hostname - u username - p password databasename > 文件 名 . sql 

备份 MySQL 数据 库 为 带 删 除 表 的 格式 ,能够 让 该 备份 覆盖 已 有 数据 库 而 不 需要 手动 
删除 原 有 数据 库 。 

mysqldump - - add- drop- table - u username - p password databasename > 文件 名 . sql 

直接 将 MySQL 数据 库 压缩 备份 : 

mysqldump - h hostname - u username - p password databasename | gzip > 文件 名 . sql.gz 

备份 MySQL 数据 库 某 个 ( 些 ) 表 : 

mysqldump - h hostname - u username - p password databasename specific tablel specific table2 > 文件 

名 .sql 


同时 备份 多 个 MySQL 数据 库 : 


mysqldump - h hostname - u username - p password - databases databasenamel databasename2 
databasename3 > 文件 名 . sql 


仅 备 份 数据 库 结 构 : 

mysqldump - no - data - databases databasenamel databasename2 databasename3 > 文件 名 . sql 
备份 服务 器 上 所 有 数据 库 : 

mysqldump - all - databases > 文件 名 . sql 

2. 还 原 数据 库 

还 原 MySQL 数据 库 的 方式 如 下 。 

mysql - h hostname - u username - p password databasename < 文件 名 . sql 

还 原 压缩 的 MySQL 数据 库 : 


gunzip < backupfile. sql.gz | mysql - u username - p password databasename 


将 数据 库 转 移 到 新 服务 器 : 
mysqldump - u username - p password databasename | mysql - host =IP 地 址 -C databasename 
3. 导 人 数据 库 


在 登录 MySQL 并 设置 访问 的 数据 库 后 ,使 用 source 命令 进行 数据 导入 ,后 面 参数 为 
脚本 文件 (如 这 里 用 到 的 . sql 文件 ) 


mysql > source /home/sa/ 文 件 名 . sql 


7.8 MySQL 数据 库 的 安全 


数据 库 作为 数据 管理 的 平台 , 它 的 安全 性 主要 由 系统 的 内 部 安全 和 网 络 安全 两 部 分 来 
决定 。 对 于 系统 管理 员 来 说 ,首先 要 保证 系统 本 身 的 安全 ,在 安装 MySQL 数据 库 时 ,需要 
对 基础 环境 进行 较为 完善 的 配置 。 通 常 ,保障 MySQL 数据 库 的 安全 性 需要 以 下 配置 。 

(1) 修改 root 用 户口 令 ,删除 空 口令 。 

安装 MySQL 时 ,root 用 户 默认 的 密码 为 空 。 为 了 安全 起 见 , 必 须 修改 为 强 密码 ,所 谓 
强 密码 ,是 指 至 少 8 位 ,由 大 小 写字 母 , 数 字 和 符号 组 成 的 不 规律 密码 。 使 用 MySQL 自 带 
的 命令 mysaladmin 修改 root 密码 ,同时 也 可 以 登录 数据 库 ,修改 数据 库 mysql 下 的 user 表 
的 字段 内 容 ,修改 方法 如 下 所 示 。 

方法 1: 使 用 SET PASSWORD 命令 。 


mysql - u root 
mysql > SET PASSWORD FOR 'root'(@ 'localhost' = PASSWORD( 'newpass'); 


方法 2: 使 用 mysqladmin。 


mysqladmin - u root Password 'newpass'; / * 适用 root 密码 为 空 * / 


mysqladmin - u root Password 'oldpass' 'newpass'; /* 适 用 root 密码 已 经 设置 * / 
方法 3: 使 用 UPDATE 直接 编辑 user 表 。 


mysql - u root 

mysql > use mysql; 

mysql > UPDATE user SET Password = PASSWORD( 'newpass') WHERE user = 'root'; 
mysql > FLUSH PRIVILEGES; 


如 果 root 密码 丢失 ,可 以 采用 如 下 方法 恢复 密码 。 


mysqld safe -- skip - grant - tablesk 

mysql - u root mysql; 

mysql > UPDATE user SET Password = PASSWORD( 'newpass') WHERE user = 'root'; 

mysql > FLUSH PRIVILEGES; 

(2) 删除 默认 数据 库 和 数据 库 用 户 。 

一 般 情况 下 ,MySQL 数据 库 安装 在 本 地 ,并 且 也 仅 由 本 地 的 PHP 脚本 对 MySQL 进 
行 读 取 ,所 以 系统 会 自动 创建 很 多 在 实际 应 用 中 并 不 需要 的 用 户 。 尤 其 是 默认 安装 的 用 户 ， 
MySQL 初始 化 后 会 自动 生成 空 用 户 和 test 库 进行 安装 测试 ,这 会 对 数据 库 的 安全 构成 威 
胁 , 有 必要 全 部 删除 ,最 后 的 用 户 只 保留 单个 root 即 可 ,当然 以 后 可 以 根据 需要 增加 用 户 和 
数据 库 。 

(3) 改变 默认 MySQL 管理 员 账 号 。 

MySQL 的 管理 员 名 称 是 root, 而 一 般 情 况 下 ,数据 库 管理 员 都 没 进行 修改 ,这 在 一 定 
程度 上 对 系统 用 户 穷 举 的 恶意 行为 提供 了 便利 ,此 时 应 修改 为 复杂 的 用 户 名 ,请 不 要 在 设 定 
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为 admin 或 者 administrator 的 形式 ,因为 它们 也 在 易 猜 的 用 户 字典 中 。 

(4) 关于 密码 的 管理 。 

密码 是 数据 库 安全 管理 的 重要 因素 之 一 ,不 要 将 纯 文本 密码 保存 到 数据 库 中 。 如 果 你 
的 计算 机 有 安全 和 危险 ,入 侵 者 可 以 获得 所 有 的 密码 并 使 用 它们 。 相 反 , 应 该 使 用 MD5、 
SHA1 或 单 向 哈 希 函数 等 对 密码 进行 加 密 。 另 外 ,也 不 要 从 词典 中 选择 密码 ,因为 有 专门 的 
程序 可 以 破解 它们 。 密 码 的 设置 规则 是 应 该 至 少 包括 8 位 由 大 小 写字 母 .数字 和 符号 组 成 
的 强 密码 。 在 存 取 密码 时 ,使 用 MySQL 的 内 置 函 数 Password() 的 sql 语句 对 密码 进行 加 
密 后 存储 。 例 如 ,以 下 语句 用 于 在 users 表 中 加 入 新 用 户 : 


mysql > INSERT INTO user (User, Password) VALUES ('user name', PASSWORD( 'userpass')); 


(5) 使 用 独立 用 户 运 行 MySQL。 

绝对 不 要 使 用 root 用 户 运 行 MySQL 服务 器 。 这 样 做 非常 危险 ,因为 任何 具有 FILE 
权限 的 用 户 都 能 够 用 root 创建 文件 。 可 以 在 DBMS 内 创建 新 的 数据 库 用 户 , 并 根据 需要 为 
这 些 用 户 赋予 不 同 的 权限 。 然 后 使 用 这 些 新 建 的 用 户 运 行 和 访问 MySQL。 

(6) 禁止 远程 连接 数据 库 。 

默认 情况 下 MySQL 是 允许 远程 连接 数据 的 ,在 命令 行 netstat -ant 下 看 到 ,默认 的 
3306 端口 是 打开 的 ,此 时 打开 了 mysqld 的 网 络 监听 ,允许 用 户 远程 通过 账号 密码 连接 本 地 
数据 库 。 为 了 禁止 该 功能 ,启动 skip-networking, 禁 止 MySQL 监听 的 任何 TCP/IP 的 连 
接 ,切断 远程 访问 的 权利 ,保证 安全 性 。 假 如 需要 远程 管理 数据 库 , 可 通过 安装 
PhpMyAdmin 来 实现。 假如 确实 需要 远程 连接 数据 库 , 至 少 应 修改 默认 的 监听 端口 ,同时 
添加 防火 墙 规则 ,只 允许 可 信任 的 网 络 的 MySQL 监听 端口 的 数据 通过 。 

(7) 限制 连接 用 户 的 数量 。 

数据 库 的 某 用 户 多 次 远程 连接 ,会 导致 DBMS 性 能 下 降 ,并且 影响 其 他 用 户 的 操作 ,有 
必要 对 其 进行 限制 。 可 以 通过 限制 单个 账户 允许 的 连接 数量 来 实现 ,设置 my. cnf 文件 的 
mysqld 中 的 max_user_connections 变量 来 完成 。GRANT 语句 也 可 以 支持 资源 控制 选项 
来 限制 服务 器 对 一 个 账户 允许 的 使 用 范围 。 

(8) 用 户 目 录 权 限 限制 。 

默认 的 MySQL 是 安装 在 /usr/local/mysql, 而 对 应 的 数据 库 文件 在 /usr/local/mysql/ 
var 目录 下 ,因此 ,必须 保证 该 目录 不 能 被 未 经 授权 的 用 户 访 问 ,防止 数据 库 文件 被 打包 复 
制 , 所 以 需要 限制 用 户 对 该 目录 的 访问 。 确 保 mysqld 运行 时 ,只 使 用 对 数据 库 目 录 具 有 读 
或 写 权 限 的 用 户 来 运行 。 

(9) 命令 历史 记录 保护 。 

数据 库 相 关 的 shell 操作 命令 都 会 分 别 记录 在 . bash_history 文件 中 ,如 果 这 些 文件 不 
慎 被 读 取 , 会 导致 数据 库 密码 和 数据 库 结构 等 信息 泄漏 。 登 录 数 据 库 后 的 操作 记录 被 保存 
在 . mysql_history 文件 中 。 例 如 ,如 果 使 用 update 表 信 息 来 修改 数据 库 用 户 密码 的 话 , 用 
户 密码 也 存在 被 非法 读 取 的 可 能 。 因 此 ,需要 删除 这 两 个 文件 ,同时 在 进行 登录 或 备份 数据 
库 等 与 密码 相关 的 操作 时 ,应 该 使 用 -p 参数 加 入 提示 输入 密码 后 , 隐 式 输入 密码 。 同 时 建 
议 将 上 述 文件 置 空 。 

(10) 禁止 MySQL 对 本 地 文件 存 取 。 


在 MySQL 中 ,提供 对 本 地 文件 的 读 取 ,使 用 的 是 load data local infile 命令 。 在 5.0 版 
本 中 ,该 选项 是 默认 打开 的 ,该 操作 会 利用 MySQL 把 本 地 文件 读 到 数据 库 中 ,然后 用 户 就 
可 以 非法 获取 敏感 信息 了 ,如 果 不 需要 读 取 本 地 文件 ,请 务必 关闭 该 选项 。 

(11) MySQL 服务 器 权限 控制 。 

MySQL 权限 系统 的 主要 功能 是 验证 连接 到 该 主机 的 用 户 , 并 根据 预先 设置 的 权限 , 赋 
予 该 用 户 在 数据 库 上 的 SELECT INSERT UPDATE 和 DELETE 等 操作 ( 详 见 user 超级 
用 户 表 )。 它 的 附加 功能 还 包括 允许 匿名 用 户 对 MySQL 特定 功能 ,例如 ,LOAD DATA IN 
FILE 等 进行 授权 及 管理 操作 的 能 力 。 

(12) 使 用 Chroot 方式 来 控制 MySQL 的 运行 目录 。 

Chroot 是 Linux 系统 中 的 一 种 高 级 保护 手段 , 它 会 建立 起 与 主 系 统 几 乎 完全 隔离 的 
“防火 墙 "。 也 就 是 说 ,一 旦 遭 到 什么 问题 ,也 不 会 危及 正在 运行 的 主 系统 。 这 是 一 个 非常 有 
效 的 办 法 ,特别 是 在 配置 网 络 服务 程序 的 时 候 。 

(13) 客户 程序 的 安全 性 保障 。 

一 般 情况 下 ,客户 程序 是 用 户 访问 数据 库 的 重要 接口 。 如 果 不 能 在 客户 端 对 用 户 输入 
内 容 进行 安全 验证 ,有 可 能 带 来 重大 的 安全 问题 。 例 如 ,黑客 会 故意 在 Web 表单 或 URL 中 
输入 一 些 特殊 字符 来 验证 Web 系统 的 安全 性 。 一 个 常见 的 场景 就 是 程序 员 需 要 在 客户 程 
序 的 输入 部 分 验证 输入 的 字符 串 。 例 如 , 当 用 户 输入 234 时 ,应 用 程序 可 能 会 执行 下 列 查 
询 ,SELECT * FROM table WHERE ID=234, 但 是 用 户 也 可 能 输入 234 OR 1==1, 这 样 就 
会 产生 如 下 的 查询 SELECT * FROM table WHERE ID=234 OR 1 二 1。 请 读者 仔细 分 析 
一 下 两 者 之 前 的 差异 。 这 种 情况 对 于 数据 库 来 说 是 极其 危险 的 。 因 此 ,在 开发 客户 程序 时 ， 
用 户 需 要 尽 可 能 地 用 多 种 形式 的 非法 请 求 访问 DBMS, 如 果 得 到 任何 形式 的 MySQL 错误 ， 
立即 深入 分 析 原因 ,及 时 修正 客户 程序 , 堵 住 漏洞 ,防止 MySQL 暴露 在 客户 程序 面前 。 


MySQL 数据 亩 押 作 


地 
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8.1 引 


本 章 以 三 个 工程 项 目 : 楼 盘 销 售 系统 、 数 据 库 精品 课程 学 习 系统 以 及 煤矿 采掘 衔接 计 
划 管 理 系统 为 应 用 实例 ,向 读者 尤其 是 初学 者 分 别 展示 基于 C/S 结构 和 基于 B/S 结构 的 数 
据 库 应 用 系统 开发 过 程 。 本 章 所 涉及 的 三 个 实例 均 是 基于 Microsoft Visual Studio. NET 
2015 平台 ,采用 C# 语 言 开发 ,使 用 MySQL 作为 数据 库 服务 器 对 数据 进行 管理 和 存储 。 三 
个 项 目的 讲解 主要 从 项 目 需求 概要 、 数 据 流 图 数据库 设计 、 系 统 流 程 、 功 能 设计 等 角度 展 
开 , 立 足 于 工程 项 目的 具体 业务 需求 ,向 读者 介绍 基于 数据 库 的 信息 管理 系统 开发 过 程 。 


8.2 楼 盘 销售 系统 


8:2:1 开关 关东 


为 减轻 售 楼 人 员 的 劳动 强度 ,提高 工作 效率 ,节省 办 公费 用 ,使 楼 盘 销 售 更 加 规范 化 、 科 
学 化 ,快捷 化 ,开发 一 套 高 效 实用 的 楼 盘 销售 系统 势 在 必 行 。 

本 系统 主要 针对 房地产 销售 业务 处 理 过 程 中 的 楼 盘 信 息 、 客 户 信息 、 销 售 信息 、 合 同 信 
息 进 行 有 效 的 管理 ,实现 对 楼 盘 销 售 等 相关 信息 的 统计 分 析 , 还 能 够 对 包括 管理 层 和 售 楼 人 
员 在 内 的 销售 团队 的 个 人 及 绩效 信息 进行 有 效 管理 。 通 过 售 楼 系统 的 开发 ,楼 盘 销 售 业务 
流程 更 加 清晰 、 高 效 ,明确 了 各 岗位 职责 ,提高 了 工作 效率 ,最 大 限度 地 减少 了 管理 漏洞 , 提 
高 了 企业 管理 水 平 。 


8.2.2 需求 分 析 


1. 功能 需求 

楼 盘 销 售 系统 应 该 具有 以 下 功能 。 

(1) 楼 盘 信息 展示 。 客 户 能 够 快速 查看 全 部 楼 盘 、 已 售 楼 盘 、 未 售 楼 盘 的 相关 信息 ,以 
数据 ,平面 图 或 虚拟 现实 等 手段 对 楼 盘 信 息 进行 展示 。 

(2) 客户 信息 管理 。 来 访客 户 的 信息 应 该 及 时 登记 保存 ,能 够 根据 来 访 次 数 或 者 意向 
支付 方式 挖掘 潜在 客户 。 

(3) 销售 管理 。 记 录 楼 盘 销 售 情况 ,对 销售 信息 进行 有 效 的 管理 。 

(4) 合同 管理 。 对 合同 信息 进行 有 效 管理 和 跟踪 。 

(5) 统计 报表 。 对 楼 盘 销 售 信息 进行 报表 统计 ,根据 实际 需要 的 不 同 ,可 以 按 楼 盘 进行 


统计 ,也 可 以 按 员 工 进行 统计 。 


(6) 销售 团队 管理 。 楼 盘 销 售 团队 包括 管理 层 和 售 楼 人 员 。 系 统 应 能 对 销售 团队 的 佣 


金 和 薪金 进行 有 效 管 理 。 


(7) 辅助 工具 。 系 统 应 提供 对 相关 法 律 的 查询 以 及 楼 盘 周边 环境 的 查询 ,支持 按揭 及 


税率 的 查询 与 计算 。 
2. 数据 流 图 
1) 顶层 数据 流 图 
顶层 数据 流 图 如 图 8-1 所 示 。 


销售 经 理 


2) 一 层 数 据 流 图 
一 层 数据 流 图 如 图 8-2 所 示 。 


楼 盘 信息 管 
理 1 


客户 管理 3 


8-1 顶层 数据 流 图 


楼 盘 信息 表 


任务 “_ [销售 团队 管 
理 6 销售 人 员 任 务 表 


管理 员 账 户 
系统 管理 4 


人 员 表 


8-2 一 层 数据 流 图 


[ 销售 主管 | 


合同 初稿 


合同 存储 


客户 详细 信息 
合同 信息 
账号 信息 
销售 报表 
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3) 二 层 数据 流 图 
楼 盘 信 息 细 化 如 图 8-3 所 示 。 


房间 信息 房间 信息 \ 房间 详细 信息 
楼 盘 信息 表 
楼 盘 信息 
车 库 信息 \ 车 库 详细 信息 
管理 1.2 楼 盘 信息 表 


8-3 二 层 数据 流 图 一 一 楼 盘 信 息 


销售 管理 细 化 如 图 8-4 所 示 。 


入内 全 二 楼 房 销售 
管理 2.1 


客户 信息 表 ”销售 报表 


车 库 销售 
管理 2.2 


8-4 二 层 数据 流 图 一 一 销售 管理 


客户 管理 细 化 如 图 8-5 所 示 。 


客户 信息 


客户 信息 表 


图 8-5 二 层 数据 流 图 一 一 客户 管理 


系统 管理 细 化 如 图 8-6 所 示 。 


管理 员 账 户 删除 = 


图 8-6 二 层 数 据 流 图 一 一 系统 管理 


合同 管理 细 化 如 图 8-7 所 示 。 


合同 初稿 
$1 


人 
合同 存储 


图 8-7 二 层 数据 流 图 一 一 合同 管理 
销售 团队 管理 细 化 如 图 8-8 所 示 。 


任务 


任务 表 


个 人 任务 
图 8-8 二 层 数据 流 图 一 一 销售 团队 管理 


3. 数据 字典 

此 处 给 出 部 分 数据 字典 。 第 
8 
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洛 和 全。 
描述 : 
来 源 : 
去 处 : 
组 成 : 
售 价 十 总 价格 
位 置 : 


楼 盘 信息 

提供 楼 盘 的 详细 信息 

原始 数据 

楼 盘 信 息 表 

期 号 十 楼 座 号 十 房间 号 十 房间 式样 十 面积 十 是 否 出 售 十 装修 状况 十 每 平方 


楼 盘 信 息 模块 


: 车 库 信息 

: 提供 车 库 的 详细 信息 

源 : 原始 数据 

: 车 库 信 息 表 

: 车 库 编号 十 位 置 十 是 否 出 售 十 价格 
: 楼 盘 信息 模块 


字 : 售 楼 人 员 信 息 

述 : 提供 售 楼 人 员 的 详细 信息 

源 : 初始 由 管理 层 设 定 ,后 续 根据 业绩 自动 更 改 

: 售 楼 人 员 信 息 表 

: 售 楼 人 员 ID 十 售 楼 任务 十 基本 工资 十 已 售 出 楼 盘 数 十 工资 总 和 
: 销售 团队 模块 


: 楼盘 销售 信息 

述 : 提供 销售 的 详细 信息 

i : 售 楼 过 程 中 自动 记录 

: 楼 盘 销售 信息 表 

: 期 号 十 楼 座 号 十 房间 号 十 买 者 姓名 十 购 楼 方式 十 经 手 者 姓名 
: 数据 管理 模块 


: 车 库 销售 信息 

: 提供 销售 的 详细 信息 

: 售 楼 过 程 中 自动 记录 

: 车 库 销售 信息 表 

: 期 号 十 车 库 编 号 十 位 置 十 买 者 姓名 十 经 手 者 姓名 
位 置 : 


数据 管理 模块 


8.2.3 系统 设计 


1. 功能 设计 
根据 数据 流 图 ,把 系统 功能 进一步 分 解 为 功能 模块 层次 图 ,如 图 8-9 所 示 。 
楼 盘 销售 系统 
楼 客 合 统 畏 销 系 
是 户 秆 同 计 助 售 中 统 
信 管 和 管 报 多 团 2 管 
息 理 理 表 售 队 四 理 


楼 | | 车 | | 客 | | 机 | | 楼 销 
房 | | 库 | | 户 | | 会 | | 房 售 
信 | | 信 | | 信 | | 管 | | 销 报 
息 | | 息 | | 息 | | 理 | | 售 表 


功能 模块 层次 图 


2. 系统 流程 图 

此 处 给 出 部 分 功能 模块 的 流程 图 。 
1) 楼 盘 信 息 模块 

楼 盘 信 息 模块 流程 图 如 图 8-10 所 示 。 
2) 客户 管理 模块 

客户 管理 模块 流程 图 如 图 8-11 所 示 。 
3) 销售 模块 流程 图 

销售 模块 流程 图 如 图 8-12 所 示 。 

3. 数据 库 设计 

1) 概念 结构 设计 

系统 E-R 图 如 图 8-13 所 示 。 

2) 逻辑 结构 设计 


根据 系统 E-R 图 ,可 以 进行 数据 库 逻 辑 结构 设计 ,得 到 楼 房 信息 表 、 车 库 信 息 表 、 客 户 
信息 表 、 楼 房 销售 表 、 车 库 销售 表 、 员 工 任务 表 、 账 号 密码 管理 表 、 合 同 管理 表 等 数据 管理 表 


格 。 下 面 给 出 部 分 系统 表格 ,如 表 8-1 一 表 8-7 所 示 。 
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楼 盘 车 库 信息 


选择 需要 显示 
的 信息 


1 
选择 具体 选择 具体 选择 具体 
| | | 
房间 详细 信 房间 详细 信 房间 详细 信 
息 、 平 面 结 息 、 平 面 结 息 、 平 面 结 
构图 构图 构图 
图 8-10 楼 盘 信 息 模块 流程 图 
开始 
客户 管理 
1 
客户 信息 管理 机 会 管理 
1 1 
按 末 访 次 数 肌体 广 
是 来 访 次 数 增加 节 
1 
完整 信息 记录 


图 8-11 客户 管理 模块 流程 图 


(a) 楼 房 实 体 


移动 电话 < 


(0) 客户 实体 (d) 售 楼 人 员 实 体 


账号 密码 


第 
(日 账号 密码 实体 8 
图 8-13 系统 ER 图 章 
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成 交 价 格 


车 库 销售 


1 1 
账号 密码 < 舍 楼 人 员 客户 


负责 楼 房 楼 房 楼 房 销售 


() 总 体 E-R 图 


图 8-13 ( 续 ) 

表 8-1 楼 房 信息 表 
字段 名 称 数据 类 型 字段 大 小 是 否 允许 空 
栋 号 varchar 4 
房间 号 varchar 8 
入 型 varchar 8 
面积 float 4 
出 售 状 态 int 4 
式样 int 4 
平方 售 价 float 4 ~ 
总 售 价 float 4 A\/ 
负责 人 varchar 5 

表 8-2 车 库 信息 表 
字段 名 称 数据 类 型 字段 大 小 是 否 允 许 空 
车 库 号 varchar 4 
式样 int 站 
出 售 状态 int 4 
售 价 float 4 
负责 人 varchar 5 


表 8-3 客户 信息 表 


字段 名 称 数据 类 型 字段 大 小 是 否 允 许 空 
身份 证 号 varchar 50 
姓名 varchar 20 
性 别 boolean 1 
联系 电话 varchar 焉 Nh 
移动 电话 varchar 旺 ~ 
客户 所 在 公司 varchar 20 
联系 地 址 varchar 50 
来 访 次 数 int 4 
表 8-4 和 售 楼 人 员 表 
字段 名 称 数据 类 型 字段 天 小 是 否 允 许 空 
编号 varchar § 
姓名 varchar 10 
底薪 float 4 
售 楼 数 int 5 x 
提成 float 4 J 
表 8-5 账户 密码 表 
字段 名 称 数据 类 型 字段 大 小 是 否 允 许 空 
个 人 账号 varchar 10 
个 人 密码 varchar 10 
员工 编号 varchar 5 
权限 varchar 党 
表 8-6 楼房 销售 表 
字段 名 称 数据 类 型 字段 大 小 是 否 允 许 空 
栋 号 varchar 4 
房间 号 varchar 8 
买主 姓名 varchar 20 
经 手 人 varchar 20 
成 交 价 格 varchar 8 
表 8-7 车 库 销售 表 
字段 名 称 数据 类 型 字段 大 小 是 否 人 允许 空 
车 库 号 varchar 4 
式样 int 4 
买主 姓名 varchar 20 
经 手 人 varchar 20 
成 交 价格 varchar 8 


发 据 亩 应 用 实例 
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8.2.4 系统 实现 


1. 开发 环境 

在 系统 设计 的 基础 上 进行 编码 、 测 试 等 工作 ,就 可 以 完成 系统 实现 。 在 系统 实现 过 程 
中 ,前 台 采 用 . NET 应 用 程序 开发 技术 ,后 台 使 用 MySQL 数据 库 管 理 系 统 。 此 处 介绍 部 分 
功能 模块 的 实现 。 

2. 数据 库 连接 

连接 数据 库 的 代码 如 下 。 


namespace DBConnection 
{ 
public class DBOperator 
{ 
public static string sconnect = string. Format ("Data Source = (local);Database = 
BuildingSale; uid = sa; pwd= sal23;"); 
public string Judgement( string text) 
{ 
2Z. SqlConnection conn; 
conn = new Z.SqlConnection(sconnect); 
conn. Open( ); 
2Z.SqlCommand comm = new 2Z.SqlCommand(Sql(text), conn); 
string s = Convert.ToString(comm. ExecuteScalar()); 
conn. Close( ); 
return s; 
} 
public string Sql(string x) 
{ 
string sql; 
sql = string. Format("select PersonPwd from personnel where PersonId = '{0}"", x); 
return sql; 
} 
public string Judgement( string text) 
{ 
Z. SqlConnection conn; 
conn = new Z.SqlConnection(sconnect); 
conn. Open( ); 
2Z.SqlCommand comm = new Z. SqlCommand(Sqll(text)，conn) ; 
string s = System. Convert.ToString(comm. ExecuteScalar()); 
conn. Close(); 
return s; 
} 
public string Sql(string x) 
| 
string sql = string.Format("select * from personnel where id= '{0}'", x); 
return sql; 


3. 主 界面 
主 界面 的 实现 如 图 8-14 所 示 。 


所 


图 8-14 主 界面 模块 实现 界面 


4. 楼 盘 信 息 模块 
楼 盘 信 息 模 块 的 实现 如 图 8-15 所 示 。 
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图 8-15 楼盘 信 息 模块 实现 界面 
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5. 客户 管理 模块 
客户 管理 模块 的 实现 如 图 8-16 所 示 。 


图 8-16 客户 管理 模块 实现 界面 


6. 销售 模块 
销售 模块 的 实现 如 图 8-17 所 示 。 


面 积 : 


总 价 : 


人 | 雄风 房 | | 查 汐 厅 售 房 | 


图 8-17 销售 模块 实现 界面 


7. 房产 法 规模 块 
房产 法 规模 块 的 实现 如 图 8-18 所 示 。 


房地产 及 建筑 法 规 
1. 中 华人 民 共 和 国 城市 房地产 管理 法 1994 年 7 月 5 日 着 而 
2 .商品房 销售 管理 办 法 2001 年 4 月 4 日 癸 有 
3. 住宅 室内 装饰 装修 管理 办 法 2002 年 3 月 5 日 癸 有 
4 .建设 工程 质量 管理 条 例 2000 年 1 月 30 日 颁布 
5. 住房 公积金 管理 条 例 。。 1393 年 4 月 3 日 癸 布 


8-18 房产 法 规模 块 实现 界面 


8. 合同 管理 模块 
合同 管理 模块 的 实现 如 图 8-19 所 示 。 


房产 买卖 合同 


8-19 合同 管理 模块 实现 界面 
在 合同 管理 中 ,输入 的 相关 信息 要 存 人 Word 文档 中 。 因 此 在 . NET 平台 中 需要 导入 | 第 
Microsoft Word 11.0 Object Library, 成 功 导 入 后 ,相关 实现 的 代码 如 下 。 
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Object Nothing = System.Reflection.Missing. Value; 
String dir = Application. StartupPath+ "\\ 合 同 管理 "; 
Directory. CreateDirectory(dir); ”// 创 建文 件 所 在 目录 
string name = txtName.Text.ToString() + ".doc"; 
string filename = @ dir +"\\" + name; // 文 件 保 存 路 径 
// 创建 Word 文档 
Word. Application WordApp = new Word. ApplicationClass(); 
Word. Document WordDoc = WordApp. Documents. Add(ref Nothing, ref Nothing, ref 
Nothing, ref Nothing); 
WordApp. Selection. Font. Size = 18; 
//WordApp. Selection. Font. Bold = (int)WdConstants.wdToggle;  // 黑 体 
WordDoc. Paragraphs. Last. Range. Text = string; // 文 件 保存 
WordDoc. SaveAs (ref filename, ref Nothing, ref Nothing, ref Nothing, ref 
Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref 
Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing); 
WordDoc. Close( ref Nothing, ref Nothing, ref Nothing); 


9. 佣金 查询 模块 
任务 佣金 查询 模块 的 实现 如 图 8-20 所 示 。 


四 在 务 佣 全 查询 


ma aa sa | 
spa: [| Iw: [LErssoj 


图 8-20 ”任务 佣金 查询 模块 实现 界面 


10. 工具 库 模 块 
工具 库 模 块 中 按揭 计算 的 实现 如 图 8-21 所 示 。 


是 控 提 及 税 费 计算 


图 8-21 按揭 计算 实现 界面 


8.3 数据 库 精 品 课程 学 习 系统 


8.3.1 开发 背景 


近年 来 , 随 着 教学 内 容 和 课程 体系 改革 的 不 断 深入 以 及 多 媒体 技术 的 发 展 ,多 媒体 技术 
与 Web 技术 的 结合 ,逐渐 成 为 网 络 教学 的 主要 形式 。 

应 当前 数据 库 教 学 的 要 求 ,其 教学 环境 和 教学 内 容 也 必须 适应 新 形势 和 新 技术 的 发 展 ， 
这 样 才 能 更 好 地 配合 教学 ,使 学 生 快 速 准确 地 了 解 和 掌握 现代 数据 库 技术 的 原理 、 方 法 和 编 
程 技术 。 鉴 于 此 ,在 目前 的 “数据 库 原理 ?教学 中 ,迫切 需要 更 新 和 补充 实践 .实验 内 容 , 因 
此 ,设计 与 开发 基于 Web 的 “数据 库 原理 ”学 习 系 统 是 十 分 必要 的 。 

在 Web 应 用 技术 的 支持 下 ,利用 微软 公司 推出 的 用 于 Web 应 用 开发 的 全 新 编程 框架 
ASP. NET, 加 上 C# 语 言 的 可 视 化 编程 功能 ,可 以 设计 出 一 个 界面 美观 ,内容 丰富 、 功 能 齐 
全 的 教学 系统 ,使 其 能 真正 对 课堂 教学 起 到 补充 作用 ,能 够 提高 学 生 学 习 的 效率 。 总 之 ,该 
系统 要 能 充分 满足 学 生 的 学 习 需 求 。 


8.3.2 需求 分 析 


1. 功能 需求 

根据 多 次 交流 探讨 ,将 该 系统 的 功能 需求 整体 划分 为 前 台 显 示 和 后 台 维护 两 个 部 分 , 具 
体 功 能 需求 如 下 。 

1) 前 台 显 示 

主要 设置 以 下 栏目 : 课程 负责 人 、 课 程 描述 .教学 队伍 .课程 学 习 资 源 .教学 规划 .教学 
评价 、 参 考 资料 .实验 教 学 .多 媒体 教学 、 双 语 教学 .下 载 专区 和 留言 区 。 前 台 显 示 子 系统 分 
为 4 个 区 ,分 别 是 信息 展示 区 、 教 学 内 容 展示 区 、 实 例 展示 区 和 意见 留言 区 。 
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(1) 信息 展示 区 。 

@ 课程 负责 人 。 该 区 域 包括 如 下 内 容 : 将 本 课程 的 课程 负责 人 的 简历 .主要 教学 工作 
历 .主要 教学 研究 和 科学 研究 工作 成 果 等 基本 情况 以 表格 的 形式 呈现 在 页 面 中 供用 户 浏 
,使 用 户 对 课程 负责 人 的 基本 信息 有 所 了 解 。 

@ 课程 描述 。 对 数据 库 这 门 课程 的 一 些 基 本 情况 进行 介绍 ,主要 有 以 下 几 个 方面 : 课 
程 历史 发 展 沿革 .课程 主要 特色 .课程 定位 与 目标 、 理 论 课 教学 内 容 、 实 践 课 教学 内 容 。 

@ 教学 规划 。 将 有 关 教 学 的 相关 内 容 在 此 介绍 。 主 要 有 教学 大 纲 文本 (课程 性 质 、 教 
学 目的 教学 内 容 、 教 学 时 数 和 教学 方式 ) .教学 方法 以 及 教学 效果 等 几 个 方面 。 

@ 教学 评价 。 各 方面 对 本 课程 的 教学 评价 ,包括 校内 同事 的 举证 评价 和 近 三 年 的 学 生 
评价 。 

@ 教学 队伍 。 对 本 课程 主讲 教师 的 简历 和 所 担任 的 教学 工作 予以 介绍 。 

(2) 教学 内 容 展示 区 。 

@ 课程 学 习 资源 。 主 要 包含 一 些 学 习 本 课程 的 相关 资源 ,包括 电子 课件 ,参考 书目 \ 作 
业 习 题 及 解答 考核 方法 .课程 录像 .综合 练习 等 。 

@ 网 上 答疑 精 选 。 将 学 生 所 提出 的 问题 和 老师 的 解答 在 此 列举 出 来 , 供 学 生 们 在 学 习 
过 程 中 进行 参考 。 

@ 双语 教学 。 主 要 提供 双语 的 教学 大 纲 、 外 教 视频 录像 等 学 习 资 源 。 

@ 实验 教学 。 关 于 本 课程 实验 课 的 内 容 , 以 及 相关 实践 项 目的 案例 下 载 。 

(3) 实例 展示 区 。 

@ 多 媒体 教学 。 主 要 提供 课程 相关 的 多 媒体 课件 .视频 .学 习 教程 等 资料 的 下 载 。 

@ 下 载 专区 。 将 本 系统 的 相关 学 习 资 源 集中 在 该 下 载 区 , 供 读者 进行 查看 和 下 载 。 

(4) 意见 留言 区 。 

为 用 户 提供 的 学 习 交 流 平台 ,具有 用 户 注册 .登录 填写 留言 .显示 留言 以 及 查看 .回复 
留言 的 功能 ; 同时 管理 员 还 有 管理 用 户 留言 的 功能 。 

2) 后 台 维护 

(1) 教学 资源 的 管理 。 

包括 下 载 专区 、 多 媒体 教学 和 课程 学 习 资 源 中 的 各 种 教学 资源 ,比如 电子 课件 ,实验 报 
告 .期 末 试 卷 ,项目 设计 案例 等 的 上 传 和 删除 功能 。 

(2) 用 户 信息 和 留言 的 管理 。 

对 用 户 的 个 人 信息 的 管理 ,管理 员 可 以 添加 、 删 除 用 户 , 对 用 户 的 留言 也 可 以 进行 删除 
等 管理 。 

(3) 页 面 的 维护 。 

可 对 各 页 面 内 容 进行 维护 ,修改 。 

2. 系统 流程 图 

系统 流程 图 如 图 8-22 所 示 。 

3. 数据 流 图 

1) 顶层 数据 流 图 

顶层 数据 流 图 如 图 8-23 所 示 。 

2) 一 层 数 据 流 图 

一 层 数 据 流 图 如 图 8-24 所 示 。 
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图 8-24 一 层 数 据 流 图 


数据 亩 应 用 实例 
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3) 二 层 数 据 流 图 
对 1 加 工分 解 的 数据 流 图 分 别 如 图 8-24 和 图 8-26 所 示 。 


bl 
教学 信息 浏览 


浏览 需求 pe 


图 8-25 浏览 需求 部 分 二 层 数 据 流 图 


留言 信息 表 


用 户 信息 所 需 信息 


ls 
上 传 专区 资源 
文件 


文件 信息 表 
图 8-26 用 户 信息 部 分 二 层 数据 流 图 


对 2 加工 分解 的 数据 流 图 如 图 8-27 所 示 。 
4. 数据 字典 


时 间 


名 字 : 
描述 : 
定义 : 


位 置 : 


用 户 信息 
记录 登录 用 户 的 基本 资料 
用 户 信息 表 王 用 户 ID 十 姓名 十 性 别 十 密码 十 电子 邮件 十 个 人 主页 十 六 


用 户 信息 表 


E 册 


用 户 信息 表 


管理 员 信息 


文件 信息 表 


图 8-27 管理 员 信息 部 分 二 层 数 据 流 图 


名 字 : 所 需 信息 
描述 : 用 户 利 用 网 站 前 台 获 取 的 信息 
定义 : 所 需 信息 = 教学 信息 十 教学 资源 信息 十 子 系统 链接 信息 位 置 : 留言 信息 表 


名 字 : 浏览 需求 
描述 : 用 户 对 系统 前 台 信息 的 浏览 需求 
定义 : 所 需 信息 二 浏览 教学 信息 需求 十 浏览 教学 资源 需求 十 子 系统 链接 需求 


名 字 : 文件 信息 
描述 : 记录 可 下 载 文件 的 相关 信息 
定义 : 文件 信息 = 文件 ID 十 文件 名 
位 置 : 文件 信息 表 


名 字 : 留言 信息 

描述 : 记录 留言 板 的 用 户 留 言 的 详细 信息 

定义 : 留言 信息 一 信息 ID 十 用 户 名 十 留言 主题 十 留言 时 间 十 留言 内 容 
位 置 : 留言 信息 表 


8.3.3 系统 设计 


1. 软件 结构 设计 

1) 系统 功能 的 层次 模块 

根据 系统 的 需求 分 析 和 总 体 设计 ,将 系统 功能 分 成 相应 的 层次 模块 ,如 图 8-28 所 示 。 
2) 系统 前 台 功 能 模块 

系统 前 台 功 能 模块 中 主要 分 为 信息 展示 模块 .教学 内 容 展 示 模 块 .资源 下 载 模块 和 用 户 


数据 亩 应 用 实例 
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数据 库 精 品 课程 学 习 系统 
前 端 显示 子 系统 | 后 台 管理 子 系统 

I I 
信 || 整 | | 资 | 有 后 | | 用 | | 留 || 资 
息 | | 肉 || 源 || 户 台 | | 户 | | 言 || 源 
展 || 容 || 下 || 留 登 | | 管 | | 管 || 管 
示 || 展 || 载 || 言 录 | | 理 | | 理 | | 理 
模 | | 者 | | 模 | | 模 模 | | 模 | | 模 | | 模 
块 || 块 || 块 || 块 块 | | 块 | | 块 || 块 


8-28 系统 模块 层次 图 


留言 模块 4 个 子 模块 。 

(1) 信息 展示 模块 。 主 要 列 出 了 本 课程 教学 的 相关 信息 供用 户 浏 览 ,主要 包括 课程 负 
责 人 、 课 程 描述 .教学 规划 ,教学 评价 教学 队伍 等 内 容 。 

(2) 教学 内 容 展示 模块 。 在 此 模块 中 主要 展示 了 一 些 教学 的 相关 资源 ,主要 包括 课程 
学 习 资 源 ` 网 上 答疑 精 选 、 双语 教 学 和 实验 教学 等 内 容 。 

(3) 资源 下 载 模块 。 本 系统 中 有 很 多 可 供用 户 下 载 的 学 习 资源 ,在 下 载 模块 中 可 以 方 
便 地 让 用 户 查看 和 下 载 所 需 的 资源 ,包括 电子 课件 ,项 目 案例 .实验 指导 书 .期末 试题 等 。 

(4) 留言 模块 。 已 注册 的 用 户 经 过 登录 后 ,可 以 在 留言 模块 进行 留言 ,也 可 以 查看 、 回 
复 别人 的 留言 。 

3) 系统 后 台 管理 模块 

(1) 后 台 登 录 模 块 。 在 前 台 首 页 的 底部 提供 了 后 台 管 理 员 入 口 ,管理 人 员 通 过 输入 正确 的 
用 户 名 和 密码 即 可 登录 到 系统 后 台 。 在 登录 时 ,如 果 用 户 名 或 密码 为 空 ,系统 将 给 予 提示 信息 。 

(2) 资源 管理 模块 。 资 源 管 理 模 块 主要 实现 对 资源 信息 管理 ,包括 分 页 显示 资源 信息 、 
添加 资源 信息 、 删 除 资源 信息 等 功能 。 

(3) 用 户 管理 模块 。 对 于 用 户 的 管理 主要 是 查看 用 户 基本 信息 和 对 于 经 常 失 信 的 用 户 
予以 删除 。 

(4) 留言 管理 模块 。 对 于 留言 的 管理 主要 是 对 留言 信息 的 查 Ee 


看 ,对 过 期 留言 的 删除 。 
2. 数据 库 设计 密码 


1) 概念 结构 设计 
系统 中 的 实体 : 管理 员 、 用 户 、 留 言 信 息 、 下 载 专 区 文件 及 实体 图 8-29 “管理 员 "实体 
的 属性 分 别 如 图 8-29 一 图 8-32 所 示 。 系 统 E-R 图 如 图 8-33 所 示 。 及 属性 


主页 邮箱 CO SS 
ED 用 户 CC 留言 信息 ET 


图 8-30 “用 户 ” 实 体 及 属性 图 8-31 “留言 信息 ?实体 及 属性 


文件 下 载 
8-32 “下 载 专区 文件 ”实体 及 属性 图 8-33 系统 E-R 


2) 逻辑 结构 设计 
数据 表 的 具体 设计 如 下 。 


(1) 用 户 信息 表 ,包括 用 户 ID、 用 户 名 、 登 录 密码 ,性别 .电子 邮箱 、 主 页 及 注册 时 间 等 ， 


如 表 8-8 所 示 。 


表 8-8 用户 信息 表 

字段 名 称 数据 类 型 字段 大 小 允许 空 说 明 
UserID int 4 用 户 ID 
UserName varchar 25 用 户 名 
Pwd varchar 32 密码 
Sex bit 由 ~ 性 别 
Email varchar 50 J 电子 邮箱 
Website varchar 150 Vv 主页 
RegTime datetime 8 注册 时 间 
(2) 管理 员 信 息 表 , 包 括 管 理 员 编 号 和 密码 ,如 表 8-9 所 示 。 

表 8-9 管理 员 信息 表 
字段 名 称 数据 类 型 字段 大 小 允许 空 说 明 
AdminID varchar 50 管理 员 编号 
AdminPwd varchar 32 密码 


(3) 留言 信息 表 , 包 括 用 户 ID 用 户 名 、 留 言 主题 .留言 时 间 和 留言 内 容 等 ,如 表 8-10 


所 示 。 
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表 8-10 ”留言 信息 表 


字段 名 称 数据 类 型 字段 大 小 允许 空 说 明 
PostID int 4 言 ID 
ParentID int 4 J 父 级 留言 ID 
UserID int 4 用 户 ID 
Subject varchar 50 留言 主题 
RegTime datetime 8 留言 时 间 
Message varchar 1000 留言 内 容 


(4) 文件 信息 表 , 主 要 用 来 存放 管理 员 上 传 的 各 种 学 习 资源 文件 ,包括 文件 的 ID 文件 
名 \ 文 件 类 型 和 文件 内 容 , 如 表 8-11 所 示 。 


表 8-11 文件 信息 表 


字段 名 称 数据 类 型 字段 大 小 允许 空 说 明 
ID int 4 文件 ID 
FileName varchar 50 文件 名 
FileType varchar 10 文件 类 型 
FileContent varchar 100 J 文件 内 容 
3. 主要 模块 流程 图 


这 一 部 分 将 对 目标 系统 做 出 精确 描述 ,以 便 在 编码 阶段 可 以 把 这 个 描述 直接 翻译 成 用 
某 种 程序 设计 语言 书写 的 程序 。 由 于 篇 幅 限制 ,这 里 只 对 两 个 主要 模块 进行 具体 描述 。 


1) 管理 员 后 台 


录 流 程 图 


管理 员 登 录 流 程 图 如 图 8-34 所 示 。 


党 
村 


后 台 管理 界面 


图 8-34 管理 员 登 录 流 程 图 


2) 下 载 专 区 文件 管理 流程 图 
管理 员 管理 下 载 专 区 文件 的 流程 图 如 图 8-35 所 示 。 


开始 


输入 管理 员 身份 信息 


打开 数据 库 


结束 = = 
8-35 ”下载 专区 文件 管理 流程 图 


8.3.4 系统 实现 


1. 教学 信息 模块 

在 前 台 左 侧 部 分 ,该 模块 介绍 了 本 课程 教学 的 相关 信息 。 主 要 包括 课程 负责 人 、 课 程 描 
述 .教学 评价 .教学 规划 和 教学 队伍 。 

2. 资源 下 载 模块 

资源 下 载 模块 主要 是 将 本 系统 中 的 可 提供 给 用 户 查看 .下 载 的 学 习 资 源 集中 起 来 供用 
户 选 择 。 该 模块 中 主要 集中 的 学 习 资源 有 电子 教案 .相关 学 习 教 程 资 料 .期 末 试 题 ,项目 设 
计 案 例 、 实 验 指导 书 教育 技术 研究 论文 和 多 媒体 教学 中 的 一 些 多 媒体 下 载 资源 。 

在 此 模块 中 首先 由 管理 员 上 传 最 新 的 各 种 学 习 资 源 , 然 后 将 文件 信息 保存 在 数据 库 中 
并 在 用 户 浏 览 的 界面 查看 到 这 些 文件 的 相关 信息 ,最 后 经 用 户 选择 可 进行 文件 的 查看 和 下 
载 。 该 模块 实现 上 传 下 载 文件 功能 的 过 程 和 对 应 的 代码 如 下 。 

1) 文件 上 传 和 删除 

文件 上 传 部 分 对 普通 用 户 是 不 可 见 的 ,只 有 管理 员 有 权限 对 这 部 分 进行 操作 管理 。 在 
用 户 实现 下 载 功能 之 前 ,首先 管理 员 要 将 各 种 学 习 资源 以 文件 的 形式 上 传 服务 器 ,将 文件 的 
信息 保存 在 数据 库 中 。 当 更 换 信息 时 ,管理 员 可 以 删除 无 用 的 文件 。 
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2) 文件 查看 下 载 

管理 员 将 文件 上 传 到 服务 器 ,同时 将 文件 信息 保存 到 数据 库 后 ,用 户 就 可 以 在 页 面 查看 
下 载 文件 的 信息 了 。 此 时 ,用 户 可 以 使 用 列表 组 件 或 普通 表格 ,并 增加 超 链接 来 实现 对 文件 
列表 的 浏览 和 下 载 。 

3. 教学 内 容 展 示 模 块 

本 模块 在 系统 前 台 的 中 间 部 分 ,主要 展示 了 本 课程 的 相关 教学 资源 ,包括 课程 学 习 资 
源 、 双 请 教学 实验 教学 和 网 上 答疑 精 选 。 

4. 留言 区 模块 

留言 区 模块 主要 为 用 户 提供 了 互相 交流 的 平台 ,在 此 可 以 浏览 留言 板 上 的 留言 ,新 用 户 
需 注册 ,已 注册 的 用 户 可 以 在 登录 后 进行 留言 查看 留言 具体 的 内 容 和 回复 留言 。 

1) 用 户 留 言 页 面 

该 页 面 供 登录 用 户 进行 留言 ,留言 页 面 如 图 8-36 所 示 。 


i 全 部 重 写 | 了 abel 


8-36 留言 页 面 


2) 查看 和 回复 留言 页 面 

在 此 页 面 用 户 可 以 查看 留言 ,也 可 以 对 某 条 留言 进行 回复 。 查 看 留言 页 面 如 图 8-37 
所 示 。 

5. 管理 员 后 台 登 录 模块 

管理 员 登 录 系统 需要 进行 密码 的 确认 ,这 一 过 程 其 实 就 是 和 数据 库 交 换 数据 ,验证 数据 
是 否 一 致 的 过 程 。 在 这 个 过 程 中 ,首先 要 做 的 工作 就 是 确认 所 输入 的 账号 是 否 存 在 ,首先 验 
证 这 一 信息 的 好 处 就 是 防止 账号 密码 的 泄漏 ,如 果 这 一 验证 过 程 不 能 通过 ,系统 就 直接 弹出 


HE 


晚上 好 ， 至 迎 光临 本 学 习 网 站 的 留言 板 
主题 留言 者 ”| 留言 日 期 留言 电子 邮件 由 作 
数据库 原理 的 学 习 心 得 jbacE |2007-6-3 21:50:51 12700.1 |cumthaoli@d163 com 


上 一 页 下 一 页 


图 8-37 查看 留言 页 面 


警告 信息 ,需要 重新 输入 账号 。 

待 输入 的 账号 在 数据 库 中 存在 后 ,系统 开始 验证 密码 ,如 果 正 确 ,系统 将 转 入 另 一 个 页 
面 。 在 判断 账号 是 否 存在 的 编码 中 ,首先 同样 是 连接 数据 库 , 读 取 UserName 字段 ,如 果 能 
够 读 到 符合 条 件 的 字段 信息 , 那 就 说 明 这 个 账号 存在 ,关键 判断 语句 如 下 。 


dr = cmd. ExecuteReader(CommandBehavior. CloseConnection); 
证 (dr.Read())// 如 果 为 真 , 则 说 明 账号 信息 存在 


如 果 两 轮 密码 判断 都 通过 , 则 通过 以 下 语句 进入 系统 后 台 管理 首页 。 


Response. Redirect("Rdmin Manage Main.aspx"); 


8.4 煤矿 采掘 衔接 计划 管理 系统 


8.4.1 需求 概要 


矿井 生产 计划 由 长 期 规划 和 中 短期 计划 两 部 分 组 成 ,其 中 ,长 期 规划 以 矿井 长 期 均衡 生 
产 为 目标 ,以 四 量 ( 开 拓 煤 量 \ 准 备 煤 量 、 回 采 煤 量 、 抽 采 达 标 煤 量 ) 管 理 为 手段 ,实现 抽 放 、 开 
拓 、 准 备 、 回 采 的 有 序 衔接 ; 中 短期 计划 是 以 生产 组 织 的 安全 性 、 高 效 性 和 衔接 性 为 目标 , 实 
现 以 原煤 回采 为 龙头 ,有 效 拉动 瓦斯 抽 放 、 埠 道 掘进 、 综 机 配套 等 相关 工程 ,合理 配置 生产 区 
队 、 综 采 设 备 等 生产 资源 ,实现 生产 组 织 的 有 序 与 高 效 。 

煤矿 衔接 计划 既是 矿井 各 专业 、 各 区 队 的 工作 依据 ,也 是 各 专业 、 各 环节 的 衔接 与 协作 
的 集中 体现 ,因此 ,保证 矿井 生产 衔接 计划 的 合理 性 和 可 行 性 是 本 项 目的 建设 重点 。 

根据 煤矿 企业 的 安全 生产 组 织 方式 以 及 管理 特点 ,煤矿 采掘 衔接 管理 系统 是 以 工程 项 
目 管理 理论 为 支撑 ,以 信息 技术 为 手段 ,将 煤矿 生产 划分 为 瓦斯 抽 放 、 综 机 配套 、 埠 道 掘进 、 
原煤 开采 (回采 ) 等 工程 项 目 , 依 据 各 专业 、 各 环节 的 生产 特点 和 支撑 要 求 ,使 各 工程 项 目 之 
间 建 立 起 相互 关联 、 互 为 支撑 的 制约 关系 ,实现 以 回采 为 龙头 的 各 专业 的 高 效 组 织 和 有 序 衔 


数据 亩 应 用 实例 


韩 品 蛋 
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接 , 以 及 对 生产 区 队 、 生 产 设备 等 资源 的 合理 配置 ,有 效 保障 矿井 生产 的 均衡 与 稳定 。 

基于 以 上 需求 ,煤矿 采掘 衔接 计划 管理 系统 主要 由 : 盘 区 规划 信息 管理 .生产 区 队 管 
理 、 生 产 设备 管理 ,工程 信息 管理 ,地 质 构 造 信 息 管理 ,采掘 衔接 计划 管理 ,计划 跟踪 与 分 析 
等 业务 模块 组 成 。 此 外 ,系统 还 包括 人 员 管 理 、 部 门 管理 .角色 管理 ,权限 管理 、 自 动 更 新 模 
块 等 基础 管理 模块 。 通 过 煤矿 采掘 衔接 计划 管理 系统 的 开发 ,煤矿 生产 计划 的 流程 更 加 清 
晰 、 高 效 。 同 时 ,明确 了 各 岗位 职责 ,将 计划 员 从 繁复 的 工作 中 解放 出 来 ,提高 生产 计划 编制 
的 效率 ,最 大 限度 减少 管理 漏洞 ,提高 煤矿 企业 的 生产 和 管理 水 平 。 


8.4.2 数据 流 图 


由 于 煤矿 采掘 衔接 计划 管理 系统 组 成 模块 较 多 ,业务 较为 复杂 ,下 面 分 别 从 整体 和 局 部 
两 个 角度 介绍 其 数据 流 图 。 

1. 顶层 数据 流 图 

通过 顶层 数据 流 图 ,对 煤矿 采掘 衔接 计划 管理 系统 的 作用 范围 进行 描述 ,同时 也 对 系统 
的 总 体 功 能 \ 输 入 和 输出 进行 了 抽象 描述 。 煤 矿 采 所 衔接 计划 管理 系统 的 顶层 数据 流 图 如 
图 8-38 所 示 。 从 顶层 数据 流 图 中 可 以 看 出 ,系统 包含 8 个 输入 数据 流 , 分 别 来 自生 产科 员 、 
区 队 管 理 人 员 、 机 电 科 员 、 采 煤 施工 人 员 ,掘进 施工 人 员 、 通 风 科 员 、 地 测 科 员 和 管理 员 的 操 
作 数 据 。 经 过 系统 处 理 后 ,5 类 施工 规划 衔接 信息 从 系统 输出 ,流向 不 同 职能 的 人 员 。 
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8-38 ”顶层 数据 流 图 


2. 一 层 数 据 流 图 

以 煤矿 采掘 衔接 计划 管理 系统 的 顶层 数据 流 图 为 基础 ,对 业务 功能 进行 分 解 和 细 化 ,并 
编号 。 明 确 各 业务 数据 的 来 源 、 加 工 、 存 储 和 流向 。 经 分 解 后 的 一 层 数据 流 图 如 图 8-39 所 
示 。 从 图 中 可 以 看 出 ,顶层 的 8 个 输入 数据 流 ,分 别 经 过 8 个 针对 性 的 管理 子 系统 ,得 到 对 
应 的 管理 信息 ,之 后 经 由 衔接 计划 管理 系统 的 处 理 , 得 到 衔接 计划 ,并 通过 各 类 图 形 或 者 报 
表 功 能 的 处 理 , 输 出 5 种 衔接 施工 规划 信息 。 

3. 二 层 数 据 流 图 

从 图 8-39 可 以 看 出 ,经 过 分 解 和 细 化 的 业务 仍然 处 于 非常 粗 的 粒度 ,对 数据 流 的 描述 
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8-39 ”一 层 数 据 流 图 


仍然 过 于 笼统 。 因 此 ,需要 对 一 层 数 据 流 图 进一步 分 解 ,生成 二 层 数 据 流 图 。 由 于 煤矿 采掘 
衔接 计划 管理 系统 涉及 的 业务 模块 较 多 ,本 部 分 主要 选择 生产 区 队 管理 .生产 设备 管理 、 采 
煤 工程 管理 ,掘进 工程 管理 、 瓦 斯 抽 放 管理 等 模块 的 数据 流 图 进行 细 化 展示 。 重 点 向 读者 展 
示 层 次 型 数据 流 图 的 分 解 过 程 。 

生产 区 队 管 理 的 二 层 数据 流 图 如 图 8-40 所 示 ,共计 包括 4 个 子 功能 : 生产 区 队 信息 维 
护 (生产 区 队 信 息 录入 、 修 改 、 删 除 等 操作 )、 生 产 区 队 信 息 查 询 、 生 产 区 队 任 务 衔接 、 生 产 区 
队 完 成 情况 分 析 等 。 
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图 8-40 二 层 数 据 流 图 一 一 生产 区 队 管 理 第 
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生产 设备 管理 的 二 层 数据 流 图 如 图 8-41 所 示 。 生 产 设备 被 分 解 为 综 采 设 备 、 综 掘 设 
备 、 钻 机 设备 .通风 设备 ,由 于 这 些 设备 的 参数 不 一 致 ,因此 ,在 生产 设备 管理 的 二 层 数 据 流 
图 中 对 这 些 数据 表 分 别 进行 描述 。 


综 采 设 备 信息 
综 采 设备 信息 表 
综 据 设备 信息 设备 衔接 计划 
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设备 统计 查 设备 统计 查询 信息 
询 3.5 
通风 设备 信息 ~ 
通风 设备 信息 表 


图 8-41 二 层 数 据 流 图 一 一 生产 设备 管理 


经 过 细 化 的 采 煤 工程 管理 二 层 数 据 流 图 如 图 8-42 所 示 ,共计 包括 6 子 功能 ,其 中 ,地 质 
构造 综合 查询 主要 依赖 地 质 构造 管理 中 与 工作 面相 关 的 数据 , 埠 道 信息 综合 查询 主要 依赖 
掘进 管理 中 与 工作 面 绑 定 的 巷道 信息 。 在 采 煤 工程 管理 的 二 层 数 据 流 图 (如 图 8-42 所 示 )， 
采 煤 工程 信息 被 进一步 分 解 为 工作 面 信息 .施工 规划 信息 以 及 依赖 的 埠 道 信息 和 地 质 构 造 
信息 。 
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图 8-42 二 层 数据 流 图 一 一 采 煤 工程 管理 


掘进 工程 管理 的 二 层 数 据 流 图 如 图 8-43 所 示 ,其 功能 主要 依据 掘进 业务 进行 进一步 分 
解 , 分 解 为 5 个 子 功能 。 掘 进 工程 管理 的 二 层 数据 流 图 (如 图 8-43 所 示 ) 对 掘进 工程 信息 进 
行进 一 步 分 解 为 巷道 信息 .施工 规划 信息 以 及 依赖 的 地 质 构造 信息 。 
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瓦斯 抽 放 管理 的 二 层 数据 流 图 如 图 8-44 所 示 ,共计 包括 5 个 子 功能 。 其 中 ,瓦斯 抽 放 
的 施工 班组 需要 具有 特殊 的 资质 。 因 此 ,施工 班组 信息 区 别 于 生产 区 队 信息 ,作为 单独 子 模 
块 进行 管理 。 在 图 8-43 中 ,瓦斯 抽 放 信息 在 二 层 数据 流 图 中 被 分 解 为 瓦斯 信息 、 施 工 规划 
信息 以 及 依赖 的 施工 班组 信息 和 地 质 构 造 信息 。 
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图 8-44 二 层 数 据 流 图 一 一 瓦斯 抽 放 管 理 
4. 数据 字典 


数据 字典 是 描述 数据 的 信息 集合 ,是 对 系统 中 使 用 的 所 有 数据 元 素 的 定义 的 集合 。 此 
处 给 出 煤矿 采掘 衔接 计划 系统 的 部 分 基础 数据 的 数据 字典 描述 。 数 据 字典 的 名 称 均 以 二 层 | 章 
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数据 流 图 中 的 约定 名 称 为 依据 。 


名 字 : 工作 面 信息 

描述 : 煤矿 采 煤 工作 面 的 基本 内 容 

来 源 : 原始 数据 

去 处 : 掘进 工程 管理 、 采 煤 施工 规划 信息 等 

组 成 : 名 称 十 采 煤 工艺 十 长 度 十 走向 长 度 十 每 层 厚度 十 煤 容重 十 瓦斯 含量 
位 置 : 基础 数据 管理 系统 的 采 煤 工程 管理 模块 


名 字 : 巷道 信息 

描述 : 提供 煤矿 巷道 的 基本 内 容 

来 源 : 原始 数据 

去 处 : 巷道 施工 规划 信息 ,地 质 构造 信息 等 

组 成 : 名 称 十 工作 面 / 盘 区 十 煤 岩 性 质 十 巷道 断面 十 支 护 方式 十 设计 长 度 
位 置 : 基础 数据 管理 系统 的 掘进 工程 管理 模块 


名 字 : 瓦斯 信息 

描述 : 提供 瓦斯 抽 放 的 详细 信息 

来 源 : 原始 数据 

去 处 : 瓦斯 抽 放 施工 规划 信息 、 瓦 斯 抽 放 衔接 计划 等 

组 成 : 区 域名 称 十 总 计划 进 尺 十 区 域 长 度 十 区 域 宽度 十 区 域 高 度 十 煤 容重 十 钻 孔 
类 型 十 吨 煤 钻 孔 进 尺 

位 置 : 基础 数据 管理 系统 的 瓦斯 抽 放 管理 模块 


名 字 : 地 质 构 造 信 息 

描述 : 提供 地 质 构造 的 详细 信息 

来 源 : 原始 数据 

去 处 : 掘进 工程 管理 、 采 煤 工程 管理 \ 瓦 斯 抽 放 管理 

组 成 : 构造 类 型 十 巷道 /工作 面 十 编号 十 位 置 十 参数 十 说 明 十 构造 长 度 
位 置 : 基础 数据 管理 系统 的 地 质 构造 管理 模块 


名 字 : 生产 区 队 信息 

描述 : 提供 生产 区 队 的 详细 信息 

来 源 : 原始 数据 

去 处 : 掘进 工程 管理 、 采 煤 工程 管理 、 瓦 斯 抽 放 管理 

组 成 : 队 组 编号 十 队 组 名 称 十 专业 十 队长 十 队 组 人 数 十 最 大 生产 能 力 十 说 明 
位 置 : 基础 数据 管理 系统 的 生产 区 队 管理 模块 


8.4.3 系统 设计 

1. 功能 设计 

根据 二 层 数 据 流 图 ,对 煤矿 采掘 衔接 计划 系统 的 业务 进一步 分 解 为 功能 模块 图 ,如 
图 8-45 所 示 。 煤 矿 采 气 衔 接 计 划 系 统 的 业务 功能 主要 由 两 大 模块 组 成 : 基础 数据 管理 系 


统 和 计划 编制 管理 系统 。 两 个 系统 相互 依赖 ,相互 协作 ,共同 实现 煤矿 采掘 衔接 计划 的 编制 
与 管理 。 


图 8-45 功能 模块 图 


2. 系统 程序 流程 图 

系统 程序 流程 图 ,是 用 统一 规定 的 标准 符号 描述 程序 运行 具体 步 又 的 图 形 表示 。 通 过 
对 输入 输出 数据 和 处 理 过 程 的 详细 分 析 , 将 计算 机 的 主要 运行 步骤 和 内 容 标 识 出 来 。 为 了 
合理 设计 程序 执行 流程 ,依据 煤矿 采掘 衔接 计划 系统 的 具体 业务 流程 ,此 处 给 出 部 分 系统 模 
块 的 程序 流程 图 。 

1) 采 煤 工程 管理 

新 建 工 作 面 程序 流程 图 如 图 8-46 所 示 。 

2) 采 煤 计划 编制 

采 煤 计划 编制 程序 流程 图 如 图 8-47 所 示 。 

3) 采 煤 衔接 计划 导出 

采 煤 衔接 计划 导出 程序 流程 如 图 8-48 所 示 。 

3. 数据 库 设计 

1) 概念 结构 设计 

根据 需求 分 析 ,抽象 出 煤矿 采掘 衔接 计划 系统 的 主要 实体 及 其 属性 如 表 8-12 所 示 。 


震 吕 溃 
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开始 


新 建 工作 面 


相关 施工 队 组 


朋 应 盘 区 是 否 存 丰 人 


创建 盘 区 创建 施工 队 组 


区 选择 相应 施工 
选择 相应 盘 区 a 


= 
数据 校 验 


采 煤 计划 编制 一 | 施工 规划 管理 施工 队 组 安排 


施工 队 生产 能 
力 是 否 匹配 ? 


生成 采 煤 计划 


图 8-47 采 煤 计划 编制 程序 流程 图 


开始 


选择 计划 内 容 


选择 计划 版 本 


按 队 组 
设置 时 间 条 件 设置 队 组 条 件 
选择 计划 模板 选择 计划 模板 
(时 间 格 式 ) 从 组 格 动 


填充 计划 数据 


生成 计划 文件 


按 工 作 面 或 盘 区 


设置 盘 区 /工作 
面条 件 


选择 计划 模板 
(工作 面 格式 ) 


8-48 ” 采 煤 衔接 计划 导出 程序 流程 图 


表 8-12 数据库 的 概念 设计 


属 性 


约 东 条 件 


盘 区 信息 


盘 区 ID, 盘 区 名 称 , 地 质 储 量 , 可 采 储 量 , 平 
均 月 产量 ,开拓 煤 量 , 开 拓 煤 可 采 周 期 ,准备 
煤 量 ,准备 煤 可 采 周 期 ,已 抽 煤 量 ,回采 煤 
量 , 回 采 周 期 


开拓 煤 可 采 周 期 ,准备 煤 可 采 周 期 、 回 采 
周期 的 单位 为 “年 ” 


生产 区 队 信 息 


队 组 ID, 队 组 名 称 , 专 业 编 号 , 队 组 人 数 ,日 
最 大 生产 能 力 ,生产 能 力 说 明 ,施工 位 置 , 队 
长 姓名 


生产 能 力 说 明 为 文本 型 , 供 生 产 区 队 进 
行 参考 


工作 面 信息 


工作 面 ID, 队 伍 ID, 工 艺 ID, 工 作 面 长 度 , 走 
向 长 度 , 剩 余 走 向 长 度 , 煤 层 厚 度 ,容量 ,可 
采 储量 ,剩余 储量 ,日 刀 数 , 吨 / 刀 , 每 米 产 
量 , 有 效 开 采 天 数 ,原始 瓦斯 含量 ,回采 前 瓦 
斯 含量 ,开始 时 间 , 结 束 时 间 , 盘 区 ID ,工作 
面 名 称 ,构造 状态 ,回采 率 


盘 区 ID 对 应 盘 区 信息 中 的 盘 区 ID 信息 


综 采 设备 信息 


设备 ID, 设 备 名 称 , 规 格 型 号 ,采购 日 期 , 生 
产 厂 家 , 吨 / 刀 , 米 / 刀 , 主 要 技术 参数 ,当前 
状态 ,目前 所 在 工作 面 


地 质 构 造 信息 


构造 人 D, 位 置 类 型 ,位 置 ID, 发 育 位 置 ,构造 
参数 ,对 生产 影响 ,构造 长 度 ,影响 天 数 , 备 


注 , 构 造 位置 


位 置 ID 为 专门 维护 的 位 置 表示 信息 


志 oo 四 


发 据 亩 应 用 实例 
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续 表 
实 体 属 性 约束 条 件 


巷道 D, 盘 区 或 工作 面 ID, 埠 道 名 称 , 岩 石 
类 型 ID, 埠 道 断 面 , 掘 进 方式 , 支 护 方 式 , 掘 
进 计划 长 度 ,剩余 长 度 , 开 工时 间 , 结 束 时 
间 , 单 头 月 进 ,关键 设备 , 队 组 ID, 类 型 


盘 区 或 工作 面 ID 对 应 盘 区 信息 或 工作 
面 信息 的 ID 
队 组 ID 对 应 生产 区 队 信息 的 队 组 ID 


埠 道 信息 


施工 规划 ID, 所 属 类 型 ,所 属 类 型 ID, 所 属 
施工 规划 信息 | 队伍 ID, 日 产量 ,总 进 尺 , 开 始 时 间 , 结 束 时 
间 ,工作 内 容 , 备 注 信息 


2) 实体 间 联 系 

根据 项 目的 需求 分 析 ,施工 规划 信息 (包括 采 煤 施工 规划 ,掘进 施工 规划 ) 很 大 程度 上 受 
所 在 作业 区 间 .生产 设备 .生产 区 队 等 信息 的 约束 。 以 掘进 施工 信息 为 例 ,掘进 施工 规划 首 
先 依托 具体 的 作业 埠 道 进行 ,同时 ,需要 生产 设备 (这 里 主要 指 掘进 设备 ) 安 装 到 位 ,生产 区 
队 的 工期 安排 合理 ,才能 够 进行 。 此 外 , 埠 道 掘进 还 受到 地 质 构 造 的 影响 , 埠 道 在 掘进 过 程 
中 , 遇 到 地 质 构造 ,有 可 能 需要 减缓 .暂停 或 停止 施工 。 因 此 ,在 掘进 施工 规划 生成 过 程 中 ， 
需要 多 种 因素 同时 考虑 。 采 煤 施工 规划 与 掘进 施工 规划 实体 关系 类 似 , 也 需要 考虑 多 种 情 


况 的 影响 。 
3) 系统 E-R 图 
综合 上 述 分 析 , 由 于 系统 整体 业务 比较 复杂 ,本 节 以 较 粗 的 粒度 向 读者 展示 E-R 图 的 
T 盘 区 信息 


名 
落 


1 n 
巷道 “上 工作 面 


(a) 煤矿 生产 区 域 E-R 图 


巷道 “| < > 施工 队 组 


掘进 施工 信息 oem >。 地 质 构造 


掘进 衔接 计划 
(b) 巷道 气 进 业务 E-R 图 
图 8-49 系统 分 ER 图 


综 采 设备 I 二 1 | 施工 队 组 
1 
条 
n 
采 煤 施工 信息 om > 地 质 构造 
n 
产生 
1 
采 焕 衔接 计划 


(©) 采 煤 业务 E-R 图 


本 1 钻机 设 | n = 1 ep 
钻机 设备 备 安装 瓦斯 抽 放 抽 放 作业 施工 队 组 


n 


瓦斯 抽 放 施工 信息 ">? 地 质 构造 


n 


产生 
1 

瓦斯 抽 放 施工 信息 
(d) 瓦斯 抽 放 业务 E-R 图 


图 8-49 ( 续 ) 


表示 ,如 图 8-49 和 图 8-50 所 示 。 在 图 8-49(a) 中 ,是 煤矿 生产 区 域 基本 组 成 单位 及 其 之 间 
的 联系 (包括 : 盘 区 、 埠 道 工 作 面 )。 图 8-49(b) 一 图 8-49(d) 分 别 表示 掘进 业务 E-R 图 、 采 
煤 业 务 E-R 图 、 瓦 斯 抽 放 业务 E-R 图 。 图 8-50 为 4 个 系统 合并 后 的 总 E-R 图 。 

3) 逻辑 结构 设计 

以 图 8-49 的 系统 E-R 图 为 基础 ,对 煤矿 采掘 衔接 软件 系统 的 数据 库 进行 逻辑 结构 设 
计 。 根 据 图 8-50, 共 有 13 个 实体 和 3 个 多 对 多 联系 ,总 计 获 得 16 张 实体 表 及 关系 表 , 但 是 
由 于 系统 还 包含 其 他 功能 ,最 终 总 计 获 得 52 张 表 。 表 8-13 一 表 8-19 分 别 给 出 煤矿 采掘 衔 
接 软件 系统 的 部 分 实体 表 进 行 描述 : 盘 区 信息 表 、 生 产 区 队 信息 表 、 综 采 设 备 信息 表 、 工 作 
面 信息 表 、 地 质 构 造 信息 表 、 埠 道 信息 表 、 施 工 规划 信息 表 。 
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表 8-13 盘 区 信息 表 


序号 字段 名 称 类 型 大 小 允许 空 含义 备 ” 注 
1 PanelID int 主键 列 ,标识 列 自 增 
2 PanelName varchar(50) 盘 区 名 称 
:| GeologicalReserves float(8) 地 质 储量 
4 WorkableReserve float(8) 可 采 储 量 
5 AverageOutputMon float(8) 平均 月 产量 
6 DevelopedReserve float(8) 开拓 煤 量 
部 DevelopedPeriod float(8) 开拓 煤 可 采 周 期 (年 ) 

8 了 PreparedReserve float(8) 准备 煤 量 
9 PreparedPeriod float(8) 准备 煤 可 采 周 期 (年 ) 
10 SuctionReserve float(8) 已 抽 煤 量 
i CoalReserve float(8) 回采 煤 量 
12 MiningPeriod float(8) 回采 周期 (年 ) 
表 8-14 生产 区 队 信息 表 

序号 字段 名 称 类 型 大 小 允许 空 含义 备 注 
1 TeamID varchar(20) 主键 列 , 队 组 编号 
2 TeamName varchar(50) 队 组 名 称 
3 | TradesID int(4) Vv 专业 编号 
4 TeamMember int(4) V/ 队 组 人 数 
5 | MaxDailyProduct float(8) ~ 日 最 大 生产 能 力 
6 ProductCapDescription varchar(200) ~ 生产 能 力 说 明 
7 ConstructionPosition varchar(50) V/ 施工 位 置 
8 TeamLeader varchar(20) JV 队长 姓名 

表 8-15 ” 综 采 设备 信息 表 

序号 字段 名 称 类 型 大 小 允许 空 和合 - 变 备 。 注 
hE! EquipmentID varchar(20) 主键 列 ,设备 编号 
2 EquipmeName varchar(200) 设备 名 称 
3 EquipmeModelCode varchar(200) 规格 型 号 
4 PurchaseDate datetime(8) Nh 采购 日 期 
5 Manufacturer varchar(200) JV 生产 厂家 
6 TonPerKnife float(8) 吨 / 刀 
7 MetersPerKnife float(8) 米 / 刀 
8 MainParameters varchar(200) ~ 主要 技术 参数 
9 EquipmentState int(4) 当前 状态 

10 CurrentlyFace varchar(20) 目前 所 在 工作 面 
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表 8-16 工作 面 信息 表 


序号 字段 名 称 类 型 大 小 允许 空 含义 
1 | FaceID int(4) 主键 列 ,标识 列 自 增 
2 TeamID varchar(50) V 队伍 ID 
3 ProcessID int(4) JV 工艺 瑟 
4 ProjectFaceLength float(8) 工作 面 长 度 
5 StrikeLength float(8) 走向 长 度 
6 RemainStrikeLength float(8) JV 剩余 走向 长 度 
和 SeamThickness float(8) 煤层 厚度 
8 Capacity float(8) 容量 
9 RecoverableReserves float(8) 可 采 储量 
10 RemainReserves float(8) V 剩余 储量 
ju DayCutter int(4) 日 刀 数 
12 TEachCutter float(8) 吨 / 刀 
13 YieldPerMeter float(8) J 每 米 产 量 
14 EffectiveDay int(4) V 有 效 开采 天 数 
15 OriginalGasContent float(8) 原始 瓦斯 含量 
16 GasConBefRecovery float(8) 回采 前 瓦斯 含量 
17 | StartTime datetime(8) Vv 开始 时 间 
18 | EndTime datetime(8) Vv 结束 时 间 
19 | PanelID int(4) 盘 区 ID 
20 FaceName varchar(50) 工作 面 名 称 
21 ConstructPlanState int(4) 构造 状态 
22 reRate float(8) 回采 率 
表 8-17 ”地质 构 造 信息 表 
序号 字段 名 称 类 型 大 小 允许 空 会 ”这 
1 StructureID int(4) 主键 列 ,标识 列 自 增 
2 LocationType varchar(30) 位 置 类 型 
3 LocationID int(4) 位 置 ID 
4 DevelopmentPosition varchar(50) JV 发 育 位 置 
5 StructureParameter varchar(50) V 构造 参数 
6 ProductivityInfluence varchar(20) NA 对 生产 影响 
7 StructureLength float(8) NA 构造 长 度 
8 InfluenceDays int(4) NA 影响 天 数 
9 Mark varchar(30) JV 备注 
10 CoalRatio float(8) ~ 构造 位 置 
表 8-18 巷道 信息 表 
序号 字段 名 称 类 型 大 小 可 为 空 含义 
1 LanewayID int(4) 主键 列 ,标识 列 自 增 
2 FacePanelID int(4) 盘 区 或 工作 面 ID 
3 LanewayName varchar(50) 埠 道 名 称 


续 表 


序号 字段 名 称 类 型 大 小 可 为 空 容 ”: 湾 备 注 
4 RockTypeID int(4) 岩石 类 型 ID 
5 SectionSize float(8) JV 巷道 断面 
6 TunnellingStyle varchar(30) JV 掘进 方式 
7 SupportPattern varchar(30) ~V 支 护 方式 
8 LanewayPlanLength float(8) 掘进 计划 长 度 
9 RemainingLength float(8) JV 剩余 长 度 
10 StartDate datetime(8) 开工 时 间 
11 EndDate datetime(8) 结束 时 间 
12 DanTouYueJin float(8) 单 头 月 进 保留 
13 KeyDevice varchar(50) 关键 设备 保留 
14 TeamID varchar(20) 队 组 ID 
15 TypeName varchar(10) 类 型 
表 8-19 施工 规划 信息 表 
序号 字段 名 称 类 型 大 小 允许 空 含义 备 注 
1 Planld int(4) 主键 列 ,标识 列 自 增 
2 PType int(4) ~ 所 属 类 型 
3 Typeld int(4) NA 所 属 类 型 ID 
4 Teamld varchar(20) ~ 所 属 队 伍 ID 
5 DayCount float(8) NA 日 产量 
6 Golength float(8) ~ 总 进 尺 
有 StartTime datetime(8) V 开始 时 间 
8 EndTime datetime(8) ~ 结束 时 间 
9 WorkContent varchar(100) NA 工作 内 容 
10 WorkNote varchar(100) ~ 备注 信息 
1a NeedDays int(4) V 保留 字段 
12 PlanCount int(4) JV 保留 字段 


表 8-20 以 巷道 掘进 业务 中 的 掘进 设备 与 巷道 信息 关联 为 例 ,描述 实体 之 间 的 关系 。 埠 
道 掘进 业务 中 的 其 他 关系 ,以 及 其 他 业务 中 的 实体 联系 与 此 相同 。 
表 8-20 ” 综 气 设备 安装 表 


序 号 字段 名 称 类 型 大 小 允许 空 含义 备 注 
1 EquipmentID varchar(20) 设备 ID 
2 LanewayID int(4) 埠 道 ID 
3 StartTime datetime(8) ~ 开始 时 间 
4 EndTime datetime(8) V 结束 时 间 


8.4.4 系统 实现 
1. 开发 流程 及 系统 实现 


在 系统 设计 的 基础 上 进行 编码 、 测 试 等 工作 ,进而 完成 系统 的 实现 。 此 处 介绍 部 分 功能 
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模块 的 实现 界面 。 

2. 主 功能 界面 

主 功能 界面 如 图 8-51 所 示 , 采 用 Docking 组 件 的 布局 方式 对 功能 导航 区 、 业 务 操作 区 ， 
Logo 展示 区 等 进行 合理 安排 和 展示 。 图 8-50 业务 区 展示 盘 区 信息 维护 功能 。 


8-51 主 功 能 界面 


3. 生产 区 队 管 理 模块 
生产 区 队 管 理 模块 的 生产 完成 情况 分 析 实 现 如 图 8-52 所 示 。 


《: 煤矿 握 》 衔接 计 蕊 软件 


-- 
0128 0 信人 和 0 人 4 20134 区位 从 


图 8-52 生产 完成 情况 分 析 实现 界面 


4. 采 煤 工程 管理 模块 
采 煤 工程 管理 中 的 施工 规划 信息 维护 模块 的 实现 如 图 8-53 所 示 。 


图 8-53 施工 规划 信息 维护 实现 界面 


s. 瓦斯 抽 放 管理 模块 
瓦斯 抽 放 管理 模块 中 采 煤 工作 面 风量 计算 的 实现 如 图 8-54 所 示 。 


按 气候 条 件 计算 按 炸 药 量 计算 
公式 : 9 条 = 哩 本 x 琴 高 x kK 激 面 长 XK 昌 加 一 级 煤矿 
0 基本: 高 一 禹 煤矿 许 用 炸药 
3 公式 : 盟 >25 x A 
Ka: 


面 长 : 
二 、 三 级 焊 矿 许 用 炸药 


公式 : 明 ?10XxA 


按照 瓦斯 一 氧化 现 ) 清 出 量 计算 
质 采 焊工 作 面 同时 作业 人 数 计算 需要 风量 


瓦斯 
人 公式 : 晕 >4x 叹 l: 


工作 面 布置 有 专用 排 瓦斯 闪 的 用 焊 工作 面 风 里 计算 
公式 : 晖 = 呼 回 + 野 尾 
0 条 回 = 100 x gq 洒 Xx Wi 又 必 = 40 x acH4 民 x Ci 


吃 回 
味 : 


号 尾 
aCHM4 尾 : 


CH: 


图 8-54 ， 采 煤 工作 面 风量 计算 实现 界面 
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数据 库 原 理 与 应 用 (MySQL 版 ) 


6. 甘 特 图 管理 模块 
甘 特 图 管理 模块 中 采 煤 计划 甘 特 图 展示 功能 的 实现 如 图 8-55 所 示 。 
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图 8-55 采 煤 计划 甘 特 图 功能 展示 


7. CAD 图 形 操 作 模 块 
CAD 图 形 操作 模块 中 AutoCAD 上 图 功能 的 实现 如 图 8-56 所 示 。 
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图 8-56 ”AutoCAD 上 图 功能 实现 


8. 用 户 管理 子 系统 
用 户 管理 子 系统 的 用 户 组 管理 及 组 权限 设置 实现 如 图 8-57 所 示 。 


图 8-57 用 户 组 管理 及 组 权限 设置 实现 界面 


9. 自动 更 新 模块 
自动 更 新 模块 中 新 版 本 检测 与 获取 的 实现 如 图 8-58 所 示 。 


[oa 


本 机 版 本 : 3,0,312 
服务 器 版 本 : 3.5.001 


[是 ] 


8-58 新 版 本 检测 与 获取 的 实现 界面 


小 结 


本 章 给 出 了 三 个 数据 库 应 用 实例 : 楼 盘 销售 系统 、 数 据 库 精品 课程 学 习 系统 和 煤矿 采 
掘 衔接 计划 管理 系统 。 每 个 应 用 实例 先 介绍 开发 背景 ; 之 后 分 析 功 能 需求 ,给 出 数据 流 图 
和 数据 字典 ,完成 需求 分 析 ; 然后 进行 系统 设计 ,包括 功能 设计 和 数据 库 逻 辑 结构 、 数 据 库 
物理 结构 设计 ; 最 后 进行 编码 .测试 等 工作 ,完成 系统 实现 。 限 于 篇 幅 ,本 章 只 给 出 了 部 分 
重要 的 内 容 , 没 有 给 出 系统 开发 过 程 的 全 部 资料 。 如 果 读 者 对 上 述 应 用 系统 感 兴趣 ,可 以 通 
过 邮件 和 著者 联系 。 


数据 亩 应 有 实例 


第 9 章 数据 库 新 技术 


数据 库 是 计算 机 科学 技术 中 发 展 最 快 ,应 用 最 广泛 的 分 支 之 一 , 它 已 经 成 为 计算 机 信息 
系统 和 计算 机 应 用 系统 的 重要 基础 和 支柱 。 其 发 展 涉及 两 种 动力 ,一 种 是 方法 论 的 发 展 , 另 
一 种 是 数据 库 技术 与 计算 机 相关 技术 的 有 机 结合 ,利用 数据 库 技术 实现 对 特定 技术 领域 数 
据 对 象 的 计算 机 管理 。 

进入 21 世纪 , 随 着 互联 网 时 代 的 到 来 ,数据 获取 方式 发 生 了 质 的 变化 ,互联 网 的 普及 使 
行业 应 用 系统 产生 的 数据 呈现 出 爆炸 式 增长 的 趋势 。 同 时 ,硬件 技术 也 飞速 发 展 。 数 据 需 
求 .数据 获取 方式 以 及 硬件 技术 的 变革 ,推动 了 大 数据 时 代 的 到 来 。 以 数据 为 中 心 的 大 数据 
时 代 , 对 数据 管理 技术 提出 了 前 所 未 有 的 挑战 ,也 迎 来 了 新 时 代 的 发 展 机 遇 。 

本 章 将 从 4 个 方面 介绍 数据 库 技 术 最 新 的 发 展 趋势 及 相应 成 果 : 第 一 部 分 ,介绍 数据 
库 技 术 结合 方法 论 的 发 展 成 果 ,重点 列举 了 面向 对 象 数据 库 和 XML 数据 库 ; 第 二 部 分 , 介 
绍 数据 库 技 术 与 其 他 计算 机 技术 或 应 用 领域 的 结合 ,重点 列举 了 分 布 式 数 据 库 和 工程 数据 
库 ; 第 三 部 分 ,对 大 数据 的 基本 概念 .性 质 ,大 时 代数 据 管理 遇 到 的 挑战 及 大 数据 存储 技术 
NoSQL 进行 概述 ; 第 四 部 分 ,介绍 数据 库 相 关 的 分 析 处 理 技术 一 一 数据 仓库 和 知识 发 现 的 

数据 建 模 方法 是 数据 库 技术 的 核心 ,大 家 已 经 学 习 过 的 层次 数据 库 、 网 状 数据 库 和 关系 
数据 库 ,都 是 以 相应 的 数据 模型 为 存储 结构 的 ,不 同 的 数据 建 模 方法 会 产生 不 同 的 数据 存储 
及 数据 操作 ,也 即 催生 出 不 同 的 数据 库 技术 。 

随 着 数据 库 应 用 领域 的 逐渐 丰富 ,数据 的 格式 日 趋 多 样 化 ,如 文本 、 声 音 、 图 像 \ 视 频 等 ， 
传统 关系 数据 库 对 这 些 复杂 对 象 的 表示 能 力 较 差 ,缺乏 灵活 有 效 的 数据 抽象 及 建 模 能 力 , 因 
此 ,人 们 提出 并 发 展 了 一 些 新 的 数据 模型 ,下 面 以 面向 对 象 数 据 模型 XML 数据 模型 为 例 
进行 重点 介绍 。 


9.1 面向 对 象 数 据 模型 


9.1.1 面向 对 象 数据 模型 的 定义 


面向 对 象 技术 是 计算 机 软件 中 发 展 非常 迅速 的 一 项 技术 。 面 向 对 象 技术 能 够 很 好 地 模 
拟 现实 世界 中 的 实体 及 实体 间 的 复杂 关系 ,使 得 来 自 现实 世界 的 应 用 需求 与 软件 实现 能 够 
很 容易 地 映射 。 因 此 ,面向 对 象 技术 得 到 了 越 来 越 多 的 应 用 。 

面向 对 象 数 据 模型 是 依据 面向 对 象 方法 所 建立 的 数据 模型 ,其 中 包括 数据 模式 (数据 结 
构 )、 建 立 在 模式 上 的 数据 操作 和 数据 约束 。 


1. 数据 模式 

由 对 象 结构 以 及 类 间 继 承 和 组 合 关系 建立 起 来 的 数据 间 的 组 织 结构 关 系 , 这 种 模式 结 
构 的 语义 表示 能 力 远 比 E-R 方法 要 强 。 

2. 数据 操作 

由 对 象 与 类 中 方法 构建 对 象 数据 模式 上 的 数据 操作 ,这 种 操作 语义 强 于 传统 数据 模型 ， 
如 可 以 构造 一 个 圆 形 类 , 它 的 操作 除 查 询 、 修 改 外 ,还 可 以 有 图 形 的 放大 /缩小 、 图 形 的 移动 、 
图 形 的 拼接 等 。 面 向 对 象 数据 操作 分 为 两 个 部 分 : 一 部 分 封装 在 类 之 中 , 称 为 方法 ; 另 一 
部 分 是 类 之 间 相 互 沟通 的 操作 , 称 为 消息 。 

3. 数据 约束 

数据 约束 也 是 一 种 方法 , 即 是 一 种 多 辑 表示 式 , 可 以 用 类 中 的 方法 表示 模式 约束 。 面 向 
对 象 数 据 一 般 使 用 方法 或 消息 表示 完整 性 约束 条 件 , 称 为 完整 性 约束 方法 或 完整 性 约束 消 
息 , 并 在 其 之 前 标 有 特殊 标识 。 

面向 对 象 数据 模型 的 直观 描述 就 是 面向 对 象 方法 中 的 类 层次 结构 图 。 面 向 对 象 数据 模 
型 中 的 对 象 由 一 组 变量 .一 组 方法 和 一 组 消息 组 成 。 其 中 ,描述 对 象 自身 特性 的 “属性 ?和 描 
述 对 象 间 相互 关联 的 “联系 ”也 常常 统称 为 “状态 ”, 方 法 就 是 施加 到 对 象 的 操作 。 一 个 对 象 
的 属性 可 以 是 另 一 个 对 象 , 另 一 个 对 象 的 属性 ,还 可 以 用 其 他 对 象 描述 ,以 此 模拟 实现 世界 
中 的 复杂 实体 。 在 面向 对 象 数据 模型 中 ,对 象 的 操作 通过 调用 其 自身 包含 的 方法 实现 。 

与 传统 数据 模型 比较 ,面向 对 象 数据 模型 具有 以 下 几 个 特点 。 

(1) 面向 对 象 模型 是 一 种 层次 式 的 结构 模型 ,以 类 为 基本 单元 ,以 继承 和 组 合 为 结构 方 
法 ,从 而 组 成 图 结构 形式 ,具有 丰富 语义 ,能 够 表达 客观 世界 复杂 的 结构 形式 。 

(2) 面向 对 象 数据 模型 是 将 数据 与 操作 封装 于 一 体 的 结构 方式 ,使 得 面向 对 象 数据 模 
型 中 的 类 是 具有 独立 运作 能 力 的 实体 ,扩大 了 传统 数据 模型 中 实体 集 仅 仅 是 单一 数据 集 的 
不 足 。 

(3) 面向 对 象 数据 模型 具有 构造 多 种 复杂 抽象 数据 类 型 的 能 力 。 可 以 用 构造 类 的 方法 
构造 数据 类 型 ,从 而 可 以 构造 多 种 复杂 数据 类 型 。 例 如 ,可 以 用 类 的 方法 构造 元 组 
(Tuple) 数组 (Array) 、 队 列 (List) 、 包 (Bag) 和 集合 (Set) 等 ,也 可 以 用 类 方法 构造 向 量 空间 
等 多 种 数据 类 型 ,使 得 数据 类 型 得 到 扩充 。 

(4) 面向 对 象 数据 模型 中 的 类 层次 结构 是 一 种 结构 化 形式 , 它 可 以 根据 需要 随时 改变 
结构 ,从 而 使 面向 对 象 数据 模型 具有 不 断 更 新 结构 的 能 力 , 这 种 能 力 称 为 模式 演化 (Schema 
Evaluation) 能 力 。 


9.1.2 面向 对 象 数 据 库 管 理 系统 


以 面向 对 象 数 据 模型 为 基础 所 构造 的 数据 库 就 是 面向 对 象 数据 库 ; 以 面向 对 象 数 据 库 
为 核心 构造 的 数据 库 管 理 系统 就 是 面向 对 象 数据 库 管 理 系统 (Object-Oriented Database 
Management System,OODBMS) 。OODBMS 由 三 个 主要 部 分 组 成 ,它们 是 类 管理 .对象 管 
理 和 对 象 控制 。 

1. 类 管理 

类 管理 主要 对 类 的 定义 和 类 的 操作 进行 管理 ,具体 内 容 如 下 。 

(1) 类 定义 : 包括 定义 类 的 属性 集 、 类 的 方法 、 类 的 继承 性 以 及 完整 性 约束 条 件 等 , 通 


数据 府 新 投 术 


数据 亩 原理 与 应 用 (MySQL 版 ) 


过 类 定义 可 以 建立 一 个 类 层次 结构 。 

(2) 类 层次 结构 的 查询 : 包括 对 类 的 数据 结构 、 类 的 方法 、 类 间 关 系 的 查询 等 。 

(3) 类 模型 演进 : 面向 对 象 数据 库 模式 是 类 的 集合 ,类 模式 为 适应 需求 变化 而 随时 间 
变化 称 为 类 模式 演进 。 它 包括 创建 新 类 、 删 除 或 修改 已 有 类 属性 和 方法 等 。 

(4) 类 管理 中 的 其 他 功能 : 如 类 权限 建立 与 删除 显示、 打印 等 。 

2. 对 象 管理 

对 象 管理 主要 完成 对 类 中 对 象 的 操作 管理 ,主要 内 容 如 下 。 

(1) 对 象 的 查询 : 在 类 层次 结构 图 中 ,通过 查询 路 径 查 找 所 需 对 象 。 查 询 路 径 由 类 、 属 
人 性、 继承 路 径 等 部 分 组 成 ,一 个 查询 可 用 一 个 路 径 表 达 式 表示 。 

(2) 对 象 的 增加 、 删 除 和 修改 操作 。 

(3) 索引 与 簇 集 : 为 提高 对 象 的 查询 效率 , 按 类 中 属性 及 路 径 建 立 索 引 以 及 对 类 及 路 
径 建 立 簇 集 。 

3. 对 象 控制 
(1) 通过 方法 与 消息 实现 完整 性 约束 条 件 的 表示 及 检验 。 
(2) 引入 授权 机 制 等 实现 安全 性 功能 。 
(3) 并 发 控制 与 事务 处 理 的 具体 实现 更 为 复杂 ,事务 处 理 还 需要 增加 长 事务 及 嵌 套 事 
务 处 理 的 功能 。 

(4) 故障 恢复 。 


9.1.3 面向 对 象 数 据 库 系统 的 概念 与 特征 


以 面向 对 象 数 据 库 管理 系统 为 核心 构造 的 数据 库 系统 就 是 面向 对 象 数据 库 系 统 
(Object-Oriented Database System, OODBS)。Francois Bancilho 把 OODBS 定义 为 :“ 一 
个 面向 对 象 的 数据 库 系 统 应 该 满足 两 条 准则 : 它 应 该 是 一 个 数据 库 管理 系统 ,而 且 还 是 一 
个 面向 对 象 的 系统 。 第 一 条 准则 是 说 它 应 该 具备 6 个 特征 : 永久 性 、 外 存 管 理 , 数 据 共享 
(并 发 ) ,数据 可 靠 性 (事务 管理 和 恢复 ) 、 即 席 查询 工具 和 模式 修改 。 第 二 条 准则 是 说 它 应 具 
备 8 个 特征 : 类 /类 型 .封装 性 /数据 抽象 继承 性 、 多 态 性 /滞后 联 编 、 计 算 完 备 性 、 对 象 标 
识 、 复 杂 对 象 和 可 扩充 性 。” 


9.1.4 面向 对 象 数据 库 系统 的 查询 


20 世纪 80 年 代 成 立 的 ODMG(Object Data Management Group) ,在 1993 年 形成 工业 
化 的 OODB 标准 一 一 ODMG 1.0, 完 成 了 对 面向 对 象 程序 设计 语言 C++ 的 数据 库 功 能 扩 
充 。1997 年 推出 的 ODMG 2.0, 内 容 涉及 对 象 模型 和 对 象 查询 语言 ,与 C++、Smalltalk 以 
及 Java 之 间 绑 定 。2000 年 再 次 推出 ODMG 3.0, 对 先前 版 本 做 了 一 些 修改 和 补充 ,基本 框 
架 和 基本 概念 未 变 。 

ODMG 工业 标准 对 C++ 的 扩展 主要 包括 C++ 对 象 定义 语言 (Object Definition 
Language,ODL) 和 C++ 对 象 操作 语言 (Object Manipulate Language. OML)。 其 中 ,OML 
又 分 为 对 象 查询 语言 (OQL) 和 对 象 控制 语言 (OCL)。 


9.1.5 面向 对 象 数 据 库 系 统 的 并 发 控制 


OODBS 中 操作 对 象 不 是 单一 的 表 而 是 具有 复杂 类 层次 结构 的 对 象 ,类 可 以 从 它 的 超 
类 中 继承 属性 和 方法 ,如 果 在 一 个 类 中 增加 和 删除 属性 或 方法 ,其 子 类 的 这 些 属性 和 方法 也 
要 增加 或 被 删除 ,这 就 意味 着 当 一 个 事务 访问 某 个 类 的 实例 时 其 他 事务 不 能 对 这 个 类 的 任 
何 超 类 进行 修改 。 因 此 ,OODBS 中 的 锁 机 制 比 传统 数据 库 系 统 要 复杂 得 多 ,给 一 个 对 象 类 
上 锁 比 给 一 个 表 上 锁 需要 更 多 的 语义 信息 。 

OODBS 中 锁 的 粒度 有 数据 库 、 类 、 对 象 . 属 性 ,物理 页 等 ,为 了 减少 访问 数据 库 过 程 中 
设置 锁 的 数目 ,应 尽量 使 同一 数据 库 享用 的 对象” 为 多 个 并 行事 务 共享 。 在 OODBS 中 采 
用 了 多 粒度 加 锁 , 锁 类 型 除了 共享 锁 (S 锁 ) 和 排他 锁 (X 锁 ) 以 外 ,还 引入 了 一 种 意向 锁 
(Intent Lock)。 意 向 锁 有 意向 共享 锁 、 意 向 排他 锁 和 共享 意向 排他 锁 之 分 。 下 面 以 类 上 的 
锁 为 例 介绍 这 几 种 锁 。 

意向 共享 锁 (IS) : 事务 T 在 类 上 加 IS 锁 表示 该 事务 可 能 对 类 中 的 实例 显 式 请 求 S 锁 。 

意向 排他 锁 (IX) : 事务 T 在 类 上 加 IX 锁 表 示 该 事务 可 能 对 类 中 的 实例 显 式 请 求 X 锁 
或 者 S 锁 。 

共享 锁 (S) : 事务 T 在 类 上 加 S 锁 表示 该 事务 不 更 新 类 中 的 实例 。 

共享 意向 排他 锁 (SIX) : 事务 T 在 类 上 加 SIX 锁 表 示 对 类 中 所 有 的 实例 都 隐 式 地 加 了 
S 锁 ,因此 ,允许 其 他 事务 并 行 地 读 该 类 中 的 实例 但 不 允许 并 行 地 更 新 类 中 的 实例 。 另 外 ， 
该 事务 还 可 能 对 类 中 的 一 些 实例 请 求 加 X 锁 。 

排他 锁 (X) : 事务 在 类 上 加 X 锁 表 示 不 允许 其 他 事务 对 该 类 的 任何 存 取 , 该 事务 可 
能 对 类 中 的 实例 显 式 请 求 X 锁 。 

上 述 几 种 锁 类 型 的 相 容 矩阵 如 表 9-1 所 示 。 

表 9-1 锁 类 型 的 相 容 性 矩阵 


S 区 IS IX SIX 
S YY N N N 
X N N N N N 
IS 8 N 至 
IX N N ¥ N 
SIX N N 于 N N 
9.2 XML 数据 库 


XML 数据 库 是 一 个 能 够 在 应 用 中 管理 XML 数据 和 文档 的 数据 库 系统 ,一 个 XML 数 
据 库 是 XML 文档 及 其 部 件 的 集合 ,通过 一 个 具有 管理 和 控制 这 个 文档 集合 本 身 及 其 所 表 
示 信 息 的 系统 来 维护 。 


9.2.1 XML 技术 


1. 什么 是 XML 
XML(eXtensible Markup Language, 可 扩展 标记 语言 ) 是 一 种 基于 SGML (Standard 
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Generalized Markup Language, 标 准 通 用 标记 语言 ) 的 简单 灵活 的 语言 。 它 与 HTML 一 
样 ,都 是 SGML 的 一 个 简化 子 集 , 融 合 了 SGML 的 丰富 功能 及 HTML 的 易 用 性 等 优点 。 

XML 是 一 种 跨 平台 语言 ,可 运行 在 任何 平台 和 操作 系统 上 。 从 本 质 上 看 ,XML 和 
HTML 都 是 由 SGML 派生 出 来 的 ,但 XML 是 一 种 元 语言 , 即 为 一 种 描述 语言 的 语言 ,而 
HTML 是 一 种 实例 化 的 标记 语言 。XML 将 SGML 的 丰富 功能 与 HTML 的 易 用 性 结合 到 
Web 的 应 用 中 ,并 保留 了 SGML 的 可 扩展 功能 ,这 使 XML 从 根本 上 有 别 于 HTML。XML 
要 比 HTML 强大 得 多 , 它 对 标记 不 再 做 限定 ,而 是 允许 自 定义 数量 不 限 的 标记 来 描述 文档 
中 的 内 容 , 人 允许 采用 嵌 套 的 信息 结构 。XML 继承 了 SGML 的 强大 功能 ,但 没有 其 庞大 与 繁 
杂 , 拥 有 了 HTML 的 简单 特点 , 却 弥补 了 其 诸多 不 足 。 

2. XML 文档 

XML 文档 就 是 指 由 XML 标记 语言 所 定义 的 符合 XML 规范 的 文本 文档 。XML 文档 
由 标记 和 文本 数据 组 成 ,其 中 ,文本 数据 就 是 原始 的 文本 。 具 体 来 看 ,一 个 XML 文档 最 基 
本 的 构成 是 XML 声明 、 处 理 指令 和 XML 元 素 。 

一 个 XML 文档 一 般 以 一 个 XML 声明 开始 。XML 声明 是 处 理 指令 的 一 种 ,用 于 为 
“version” 属 性 (指明 所 采用 的 XML 版 本 号 ) “standalone” 属 性 (表明 XML 文档 是 否 与 一 
个 外 部 文档 类 型 定义 相关 联 ) 和 “encoding” 属 性 (指明 XML 文档 所 采用 的 编码 标准 ) 赋 值 。 

处 理 指令 为 处 理 XML 文档 的 应 用 程序 提供 信息 。XML 解析 器 不 处 理 这 些 指令 ,而 将 
它们 原样 传 给 应 用 程序 。 应 用 程序 解释 这 些 指令 ,按照 它们 提供 的 信息 进行 处 理 。 

元 素 是 XML 文档 的 基本 单元 。 一 个 元 素 代表 文档 中 的 一 个 逻辑 组 件 。 元 素 可 以 互相 
幅 套 ,形成 树 状 结构 。 包 含 所 有 其 他 元 素 的 元 素 称 为 根 元 素 ,包含 在 根 元 素 中 的 元 素 称 为 根 
元 素 的 子 元 素 , 子 元 素 还 可 以 包含 自己 的 子 元 素 。 


9.2.2 XML 数据库 


XML 数据 库 是 一 种 Web 数据 库 , 它 是 可 以 对 XML 文档 进行 存 取 管 理 和 数据 查询 的 
数据 库 ,是 一 个 能 够 在 应 用 中 管理 XML 数据 和 文档 的 数据 库 系统 。 简 单 地 说 ,XML 数据 
库 就 是 一 个 XML 文档 的 集合 ,这 些 文档 是 持久 的 ,并 且 是 可 以 操作 的 。 

XML 数据 库 可 以 这 样 定 义 : 一 个 XML 数据 库 是 XML 文档 集 及 其 部 件 的 集合 ,这 些 
文档 是 持久 的 和 可 操作 的 ; 它们 由 一 个 具有 能 力 管理 和 控制 这 个 文档 集合 本 身 及 其 所 表示 
信息 的 软件 系统 (XMLDBMS) 管 理 。XML 数据 库 不 仅 是 结构 化 数据 和 半 结 构 化 数据 的 存 
储 库 , 像 管理 其 他 数据 一 样 ,持久 的 MXL 数据 管理 包括 数据 的 独立 性 、 集 成 性 ,访问 权限 、 
视图 ,完备 性 ,元 余 性 一致 性 以 及 数据 恢复 等 。 

XML 数据 库 提供 了 传统 数据 库 所 具有 的 特点 ,如 存储 (以 XML 文档 形式 ) 、 数 据 库 的 
模式 (DTD 或 MXL Schema) 、 查 询 语言 (XQuery、XPath、XQL、XML-QL 等 ) .编程 接口 (如 
SAX、DMO) 等 。 但 与 传统 数据 库 相 比 , 它 在 存储 、 索 引 、 安 全 、 多 用 户 访问 、 事 务 管理 等 方面 
还 存在 不 足 之 处 。 在 一 定 的 环境 下 ,例如 ,在 数据 量 和 操作 用 户 较 少 并 且 性 能 要 求 不 高 的 情 
况 下 ,XML 文档 能 够 作为 数据 库 在 应 用 程序 中 使 用 ; 如 果 应 用 程序 有 许多 操作 用 户 ,并且 
要 求 严格 的 数据 完整 性 和 性 能 要 求 , 则 不 宜 于 采用 XML 文档 。 

XML 数据 库 具有 以 下 几 个 特点 。 

(1) XML 数据 库 是 一 组 XML 文档 的 集合 ,并 且 是 持久 的 和 可 操作 的 ; 


(2) 有 专门 的 DBMS 管理 (不 是 XML 文件 系统 ); 

(3) 文档 都 是 有 效 的 ( 即 符合 某 一 模式 ); 

(4) 文档 的 集合 可 能 基于 多 个 模式 文件 ( 即 文件 扩展 名 为 . xsd) ,多 个 模式 文件 之 间 可 
能 有 语法 和 语义 上 的 相互 联系 。 


9.2.3 XML 数据库 分 类 


XML 数据 库 包括 三 种 : 原生 XML 数据 库 (Native XML Database, NXDB) ,支持 XML 
的 数据 库 (XML Enable Database, XEDB) 和 混合 XML 数据 库 (Hybrid XML Database， 
HXDB) 。 

1. 原生 XML 数据 库 

NXDB 以 一 些 新 兴 的 数据 库 厂 商 ( 如 Software AG) 为 代表 通过 采用 符合 XML 文档 特 
征 的 数据 库 模 型 (一 般 为 层次 数据 存储 模型 ) ,能 对 XML 文档 进行 “Native” 存 储 和 在 文档 
节点 级 进行 查询 与 操作 。 

NXDB 是 专门 设计 用 于 存储 和 管理 XML 文档 的 数据 库 , 它 以 XML 文档 作为 数据 库 的 
存储 单元 进行 操作 和 管理 ,不 关心 数据 的 底层 存储 格式 ,只 能 通过 XML 特有 的 相关 技术 对 
数据 进行 存储 。 一 般 采 用 层次 数据 存储 模型 ,保持 XML 文档 的 树 状 结构 ,省 掉 了 XML 文 
档 和 传统 数据 库 的 数据 转换 过 程 。 

2. 支持 XML 的 数据 库 

XEDB 以 传统 的 (关系 ) 数 据 库 厂商 (Oracle、.IBM、Microsoft 等 ) 为 代表 。 其 主要 思想 是 
在 原 有 数据 库 基 础 上 扩展 了 XML 支持 模块 ,完成 XML 数据 和 数据 库 之 间 的 格式 转换 和 传 
输 。 从 存储 粒度 上 ,可 以 把 整个 XML 文档 作为 关系 数据 库 (RDB) 表 中 的 一 行 ,或 把 XML 
文档 进行 解析 后 ,存储 到 相应 的 表格 中 。 

XEDB 的 基本 存储 单元 是 XML 数据 (XML 文档 所 提供 的 数据 ) ,主要 是 通过 增加 一 个 
映射 层 来 管理 XML 数据 的 存储 。 数 据 首先 要 与 一 个 明确 的 格式 相 匹配 ,符合 要 求 的 才能 
根据 预先 定义 好 的 规则 映射 到 数据 库 ( 如 对 象 关 系 型 数据 库 ) 中 ,但 可 能 会 损失 一 部 分 元 数 
据 和 最 初 的 结构 。 同 时 可 从 现 有 的 数据 库 中 生成 XML 页 面 ,但 不 能 保证 与 当初 存 入 的 原 
始 页 面 完 全 符合 。 

3. 混合 XML 数据 库 

HXDB 则 是 通过 XML 和 其 他 的 访问 接口 对 XML 进行 管理 和 操作 。HXDB 主要 是 一 
种 系统 集成 技术 ,其 目的 是 综合 XEDB 和 NXDB 的 优点 ,但 其 底层 并 没有 一 种 统一 的 数据 
库 模 型 。Oracle 10g 中 引入 的 XML DB 技术 是 HXDB 的 典型 代表 。 


9.2.4 XML 数据 库 管理 系统 


根据 数据 库 的 三 层 管理 系统 结构 理论 ,可 以 构建 XML 数据 库 管理 系统 的 基本 框架 ,如 
图 9-1 所 示 。 

外 层 主要 提供 了 一 个 可 以 给 用 户 和 应 用 程序 查询 、 修 改 的 接口 ,DOM (Document 
Object Model, 文 档 对 象 模型 ) 是 一 种 与 浏览 器 平台、 语言 的 接口 ,用 来 访问 页 面 其 他 部 分 
的 标准 组 件 。DOM 解决 了 Netscape 的 JavaScript 和 Microsoft 的 JScript 之 间 的 冲突 ,给 
予 Web 设计 师 和 开发 者 一 个 标准 的 方法 来 访问 其 站 点 中 的 数据 .脚本 和 表现 层 对 象 。 可 以 
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外 层 DOM、URL 、XPath 等 应 用 程序 


图 9-1 XML 数据 库 管理 系统 


在 XML 结构 内 引用 、 检 索 和 更 改 XML 结构 中 的 各 项 内 容 。 

概念 层 涉及 XML 数据 的 组 织 、 存 储 粒度 的 设计 等 ,然后 在 数据 模型 中 提供 操作 来 存 
储 、 查 询 和 操作 数据 。 

内 层 主 要 是 提供 XML 文档 的 数据 结构 ,包括 元 素 、 属 性 、 字 符 数据 表 等 最 基本 的 组 成 
单元 ,XML 数据 库 的 灵活 性 也 主要 表现 在 这 一 级 。 

从 图 9-1 可 以 看 出 ,XML 数据 库 模 型 与 对 象 数 据 模 型 十 分 相似 ,因为 它 同 样 也 是 由 节 
点 组 成 的 ,并 且 每 个 节点 都 可 以 包含 异类 数据 。 而 XML 数据 库 节点 异类 的 程度 大 部 分 取 
决 于 用 于 定义 XML 文档 结构 的 特定 DTD 或 模式 。 


9.3 ”分布 式 数据 库 系统 


分 布 式 数 据 库 是 数据 库 技术 与 分 布 处 理 技术 相 结 合 的 产物 ,其 始 于 20 世纪 70 年 代 中 
期 。 在 实际 应 用 中 ,由 于 各 个 单位 (例如 一 些 大 型 企业 或 连锁 企业 等 ) 自 身 经 常 就 是 分 布 式 
的 ,在 逻辑 上 分 成 公司 部门 和 工作 组 ,在 物理 上 也 被 分 成 诸如 车 间 和 实验 室 等 ,这 就 意味 着 
各 种 数据 是 分 布 式 的 。 单 位 中 各 个 部 门 都 维护 着 自身 的 数据 ,单位 的 整个 信息 就 被 分 解 成 
了 “信息 孤岛 ”分 布 式 数据 库 正 是 针对 这 种 情形 建立 起 来 的 “信息 桥梁 ?>。20 世纪 90 年 代 
以 来 ,分布 式 数据 库 进 入 到 商品 化 应 用 阶段 ,传统 关系 数据 库 产品 逐渐 发 展 成 以 计算 机 网 络 
和 多 任务 操作 系统 为 核心 的 分 布 式 数 据 库 产 品 。 


9.3.1 分 布 式 数据 库 及 其 分 类 


1. 分 布 式 数据 库 

分 布 式 数据 库 (Distributed Data Base, DDB) 是 计算 机 网 络 环境 中 各 场地 (Site) 或 节点 
CNode) 上 数据 库 的 逻辑 集合 。 它 是 一 组 结构 化 的 数据 集合 ,逻辑 上 属于 同一 系统 ,而 物理 
上 分 布 在 计算 机 网 络 的 不 同 节点 上 ,具有 分 布 性 和 逻辑 协调 性 的 特点 。 分 布 性 指数 据 没有 
存放 在 单一 节点 的 存储 设备 上 ,而 是 按 全 局 需要 分 散 地 存储 在 各 个 节点 上 。 逻 辑 协调 性 是 


指 各 节点 上 的 数据 子 集 之 间 由 严密 的 约束 规则 加 以 限定 ,在 逻辑 上 是 一 个 整体 。 

2. 分 布 式 数据 库 的 分 类 

分 布 式 数据 库 的 类 型 很 多 ,根据 不 同 的 准则 ,有 不 同 的 分 类 方法 。 

(1) 按 数 据 元 余 分 类 : 完全 复制 型 .完全 分 割 型 . 子 集 复 制 型 , 子 集 分 布 型 。 

(2) 按 全 局 数据 库 的 构成 分 类 : 同 构 型 分 布 数据 库 、 异 构 型 分 布 数据 库 。 

(3) 按 本 地 数据 库 的 配置 方式 分 类 : 可 分 布 访问 的 集中 数据 库 、 中 心 数据 库 加 专用 数 
据 库 、 多 级 分 布 数据 库 、 水 平分 布 数据 库 。 

(4) 按 本 地 数据 库 的 数据 是 否 全 部 集成 到 全 局 数据 库 中 分 类 : 对 等 型 分 布 数据 库 
(Peer-to-Peer DBS) ,多 数据 库 系 统 (Multi-DBS)。 


9.3.2 分 布 式 数据 库 的 特点 


1. 数据 独立 性 与 位 置 透明 性 

数据 独立 性 是 数据 库 方法 追求 的 主要 目标 之 一 ,位 置 透 明 性 指 用 户 不 必 关 心 数据 物理 
位 置 分 布 的 细节 ,也 不 必 关 心 重复 副本 (元 余数 据 ) 的 一 致 性 问题 。 有 了 位 置 透明 性 ,用 户 的 
应 用 程序 书写 起 来 就 如 同 数据 没有 分 布 一 样 , 当 数据 从 一 个 节点 移 到 另 一 个 节点 时 不 必 改 
写 应 用 程序 , 当 增 加 某 些 数据 的 重复 副本 时 也 不 必 改 写 应 用 程序 。 数 据 分 布 的 信息 由 系统 
存储 在 数据 字典 中 。 

2. 集中 和 自治 相 结合 

在 集中 式 数 据 库 中 ,为 了 保证 数据 库 的 安全 性 和 完整 性 ,对 共享 数据 库 的 控制 是 集中 
的 ,并 设 有 DBA 负责 监督 和 维护 系统 的 正常 运行 。 在 分 布 式 数据 库 中 ,数据 的 共享 有 两 个 
层次 : 一 是 局 部 共享 ,局 部 数据 库 中 存储 局 部 节点 的 共享 数据 ,这 些 数据 是 本 节点 用 户 共享 
的 ; 二 是 全 局 共享 ,各 个 节点 也 存储 可 供 其 他 节点 用 户 共享 的 数据 ,支持 系统 的 全 局 应 用 。 
因此 ,相应 的 控制 结构 也 有 两 个 层次 : 集中 和 自治 。 各 局 部 的 DBMS 可 以 独立 地 管理 局 部 
数据 库 , 具 有 自治 的 功能 ,同时 ,系统 又 设 有 集中 控制 机 制 ,协调 各 局 部 DBMS 的 工作 ,执行 
全 局 应 用 。 当 然 ,不 同系 统 集中 和 自治 的 程度 不 尽 相同 。 有 些 系统 高 度 自 治 , 有 些 系统 则 集 
中 控制 程度 较 高 ,节点 自治 功能 较 弱 。 

3. 支持 全 局 数据 库 的 一 致 性 和 可 恢复 性 

分 布 式 数据 库 中 各 局 部 数据 库 应 满足 集中 式 数 据 库 的 一 致 性 .可 串 行 性 和 可 恢复 性 。 
此 外 ,还 应 保证 数据 库 的 全 局 一 致 性 .并 行 操作 的 可 串 行 性 和 系统 的 全 局 可 恢复 性 。 这 是 因 
为 全 局 应 用 要 涉及 不 同 节点 上 的 多 个 操作 。 例 如 ,银行 转账 业务 包括 两 个 节点 的 更 新 操作 。 
这 样 , 当 其 中 某 一 个 节点 出 现 故 障 , 操 作 失 败 后 如 何 使 全 局 业务 回 深 呢 ?如 何 使 男 一 个 节点 
撤销 已 执行 的 操作 ( 若 操作 已 完成 或 完成 一 部 分 ) 或 者 不 必 再 执行 业务 的 其 他 操作 ( 若 操作 
尚 没 执行 )? 这 些 技 术 要 比 集中 式 数 据 库 复杂 和 困难 得 多 ,分 布 式 数据 库 系统 必须 解决 这 些 
问题 。 

4. 复制 透明 性 

用 户 不 用 关心 数据 库 在 网 络 中 各 个 节点 的 复制 情况 ,被 复制 数据 的 更 新 都 由 系统 自动 
完成 。 在 分 布 式 数据 库 系统 中 ,可 以 把 一 个 节点 的 数据 复制 到 其 他 节点 存放 ,应 用 程序 可 以 
使 用 复制 到 本 地 的 数据 在 本 地 完成 分 布 式 操作 ,避免 通过 网 络 传输 数据 ,提高 了 系统 的 运行 
和 查询 效率 。 但 是 对 于 复制 数据 的 更 新 操作 ,就 要 涉及 对 所 有 复制 数据 的 更 新 。 
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5. 易于 扩展 性 
支持 透明 的 水 平 扩展 ,可 以 增加 多 个 节点 来 进一步 分 布 数据 和 分 担 处 理 任 务 。 


9.3.3 分 布 式 数据 库 的 分 级 结构 


按照 ANSI/SPARC 的 描述 ,集中 数据 库 的 分 级 结构 是 包含 外 模式 、 概 念 模式 、 内 模式 
的 三 级 结构 。 分 布 式 数据 库 的 分 级 结构 较为 复杂 ,具体 描述 如 下 。 

1. 对 等 型 分 布 数 据 库 的 分 级 结构 

对 等 型 的 分 级 结构 如 图 9-2 所 示 , 它 的 全 局 概念 模式 是 所 有 节点 本 地 概念 模式 的 并 集 。 


外 模式 | | | 外 模式 2 | …*… | 外 模式 
ee 
本 地 概念 模式 1 本 地 概念 模式 2 | …… | 本 地 概念 模式 " 
本 地 内 模式 1 本 地 内 模式 2 | …… rai 


图 9-2 ANSI/SPARC 分 布 DB 参考 结构 


对 等 型 分 布 数据 库 的 全 局 概念 模式 较为 简单 , 它 可 以 是 本 地 概念 模式 的 简单 并 集 。 在 
使 用 关系 模型 时 则 是 若干 关系 框架 的 集合 ,描述 分 布 数据 库 的 所 有 全 局 关系 ; 本 地 概念 模 
式 则 描述 局 部 关系 (也 称 段 ) ,是 全 局 关系 的 子 集 , 每 个 子 集 由 单个 全 局 关系 经 关系 运算 导 
出 ; 本 地 内 模式 给 出 存储 在 本 地 节点 上 的 所 有 局 部 关系 的 物理 表示 , 它 与 集中 数据 库 时 的 
情况 相同 ; 全 局 外 模式 定义 导出 关系 和 与 之 相 联系 的 访问 控制 规则 。 

2. 多 数据 库 系统 的 分 级 结构 

多 数据 库 系统 放宽 了 分 布 数 据 库 中 所 有 数据 从 逻辑 上 看 必须 都 在 一 个 全 局 数据 库 中 的 
要 求 , 允 许 部 分 数据 只 供 本 地 用 户 使 用 。 这 里 有 如 下 两 种 参考 结构 。 

(1) 带 有 全 局 概念 模式 的 参考 结构 ,如 图 9-3 所 示 。 在 此 种 结构 中 ,全 局 概念 模式 是 本 地 
概念 模式 的 集成 。 本 地 用 户 的 外 模式 定义 在 本 地 概念 模式 上 ,不 改变 本 地 用 户 原来 使 用 本 地 
数据 库 的 方式 。 全 局 用 户 的 外 模式 定义 在 全 局 概念 模式 上 ,用 统一 的 语言 访问 多 数据 库 。 


全 局 外 模式 1 全 局 外 模式 2 [全 局 外 模式 3 
本 地 外 模式 1 | 本 地 外 模式 1> | 本 地 外 模式 13 || 全 局 概念 模式 | | 本 地 外 模式 本 地 外 模式 nm 


本 地 概念 模式 1 | 2 本 地 概念 模式 n 


本 地 内 模式 1 | 2 本 地 内 模式 n 
图 9-3 有 全 局 概念 模式 的 MDBS 结构 


(2) 无 全 局 概念 模式 的 参考 结构 ,如 图 9-4 所 示 。 在 此 种 结构 中 ,将 MDBS 分 布 为 两 
层 : 本 地 系统 层 和 多 数据 库 层 。 本 地 系统 层 由 各 本 地 数据 库 组 成 ; 多 数据 库 层 由 多 数据 库 
用 户 的 外 模式 组 成 。 这 些 外 模式 可 以 定义 在 一 个 或 多 个 本 地 概念 模式 上 。 用 户 用 编程 通过 
外 模式 访问 MDBS, 而 将 对 各 本 地 数据 库 访问 的 责任 交 给 了 多 数据 库 层 与 本 地 系统 层 之 间 
的 映射 。 


Multidatabase 外 模式 1 外 模式 2 外 模式 3 | 
Layer 


LocalSystem 


Layer 本 地 概念 模式 1 本 地 概念 模式 2 本 地 概念 模式 3 


本 地 内 模式 1 本 地 内 模式 2 本 地 内 模式 3 


图 9-4 无 全 局 概念 模式 的 MDBS 结构 


3. 联邦 式 结构 

联邦 数据 库 系 统 由 一 组 既 协 同 工 作 又 独立 自治 的 部 件数 据 库 系 统 ES 
组 成 ,如 图 9-5 所 示 ,联邦 数据 库 结构 包含 如 下 几 个 部 分 。 

(1) 本 地 模式 : 它 是 部 件 DBS 的 概念 模式 。 过 滤器 ) 

(2) 部 件 模式 : 它 是 本 地 模式 经 转换 器 处 理 后 变 成 FDBS 公共 数 
据 模型 的 形式 。 联邦 模式 | 

(3) 输出 模式 : 它 给 出 了 部 件 模式 可 被 FDBS 使 用 的 一 个 子 集 和 
一 些 访问 控制 信息 。 构造 器 

(4) 联邦 模式 : 它 是 各 输出 模式 的 并 集 , 由 各 输出 模式 经 构造 器 公 
生成 。 输出 模式 名 

(5) 外 部 模式 : 外 模式 由 联邦 模式 经 过 滤器 导出 ,其 数据 模型 可 以 内 
不 同 。 ig ) 

(6) 转换 器 : 把 一 种 数据 模型 (格式 ) 转 换 为 男 一 种 数据 模型 ( 格 i 
式 )。 把 一 种 数据 语言 转换 为 男 一 种 数据 语言 。 

(7) 过 滤器 : 限制 从 一 层 处 理 器 传送 到 另 一 层 处 理 器 的 命令 和 相 Ce 
应 的 数据 。 

(8) 构造 器 : 把 单个 处 理 器 的 操作 ,分解 . 复 制 成 多 个 操作 (查询 分 「 林地 模式 
解 ) 。 把 多 个 处 理 器 产生 的 数据 合并 成 单个 数据 集合 (模式 集成 ) 。 
9.3.4 分 布 式 数 据 库 的 数据 分 布 人 


数据 分 布 的 主要 目的 是 提高 访问 的 局 部 性 。 即 通过 数据 的 合理 分 图 9-5 联邦 数据 库 
布 ,使 更 多 的 数据 尽 可 能 就 地 存放 ,减少 远 距 离 数据 访问 。 3 

数据 分 布 包 括 分 割 和 分 配 两 个 方面 .可 以 描述 为 以 下 两 个 步骤 : 先 从 逻辑 上 将 全 局 概 
念 模式 , 即 全 局 关系 模式 ,划分 成 若干 逻辑 片断 ( 子 关系 ) 一 分 割 ; 再 按 一 定 的 宛 余 度 将 片 | 第 
断 分 配 到 各 个 节点 上 ,这 时 逻辑 片断 就 成 为 具体 的 物理 片断 一 分 配 。 


地 
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分 布 式 数据 库 分 割 后 仍 应 保持 原 有 特质 ,分 割 后 的 各 人 逻辑 关系 之 间 应 遵循 下 列 原 则 。 

(1) 完整 性 原则 。 全 局 关系 的 所 有 数据 项 必须 包括 在 任何 一 个 片断 中 。 不 允许 出 现 某 
个 数据 项 属于 全 局 关系 ,但 却 不 属于 任何 片断 。 

(2) 重 构 性 原则 。 所 有 片断 必须 能 重 构 ( 逆 操作 ) 成 全 局 关系 。 

(3) 不 相交 原则 。 不 相交 原则 不 是 必需 的 ,但 有 这 条 原则 可 以 使 分 割 不 致 引起 太 复杂 
的 情况 。 分 割 时 不 相交 , 则 分 配 时 的 元 余 可 以 得 到 控制 。 

分 割 后 的 工作 便 是 分 配 。 分 配 的 目标 是 将 已 分 割 好 的 片断 分 配 到 不 同 的 节点 中 去 ,使 
得 某 节 点 对 某 片 断 的 访问 尽量 为 本 地 访问 。 数 据 分 配 一 般 有 以 下 几 种 方式 。 

(1) 集中 型 。 数 据 虽 经 划分 ,但 所 有 逻辑 片断 完全 集中 在 一 个 节点 上 ,仍然 像 一 个 集中 
数据 库 一 样 。 

(2) 分 割 型 。 数 据 被 划分 后 ,所 有 逻辑 片断 各 自分 配 在 一 个 节点 上 ,所 有 节点 上 分 配 的 
只 是 全 局 关系 的 一 个 子 关系 。 

(3) 混合 型 。 数 据 被 划分 后 的 逻辑 片断 根据 需要 分 配 ,共享 的 片断 在 需要 共享 的 节点 
上 重复 设置 ,高度 私 用 的 片断 只 设置 在 所 需要 的 节点 上 。 


9.4 工程 数据 库 


9.4.1 工程 数据 库 基 本 概念 


早 在 计算 机 出 现 之 前 ,就 有 了 对 工程 应 用 领域 数据 进行 组 织 和 管理 的 需求 ,工程 师 们 通 
过 系统 地 使 用 组 表 (Set Tables) 、 图 表 (Picture Tables) 和 工程 图 等 方法 来 描述 系统 的 流程 
和 结构 。 其 中 ,组 表 、 图 表 实 际 上 就 是 二 维 表 。 随 着 计算 机 和 数据 库 技术 的 飞速 发 展 ,20 世 
纪 70 年 代 末 ,数据 库 技术 在 商业 数据 管理 上 取得 明显 进展 ,特别 是 计算 机 辅助 设计 (CAD) 
的 出 现 ,产生 了 对 大 量 工程 数据 管理 的 迫切 要 求 。 

1975 年 ,美国 洛克 希 德 公司 的 Eastman 首先 描述 了 一 个 可 用 于 CAD 的 数据 库 ,随后 各 
研究 机 构 、 大 学 及 有 关公 司 也 开展 了 有 关 将 数据 库 技术 应 用 到 工程 数据 管理 上 的 研究 。 
1985 年 ,在 伦敦 召开 的 第 四 届 国 际 工程 软件 会 议 上 ,详细 讨论 了 工程 数据 库 在 工程 设计 和 
工程 数据 管理 中 的 作用 工程 数 据 库 管理 系统 (EDBMS) 的 特点 、 类 型 及 术语 等 ,这 些 讨论 为 
工程 数据 库 理 论 的 建立 起 到 了 巨大 的 推动 作用 。 

目前 ,工程 数据 库 还 没有 一 个 统一 的 定义 ,普遍 认可 的 定义 是 : 工程 数据 库 
(Engineering Database) 是 存储 ,管理 和 使 用 工程 设计 所 需 数据 的 数据 库 , 是 将 工程 设计 方 
法 、 人 工 智 能 技术 与 数据 库 技术 相 结 合 发 展 起 来 的 智能 化 的 CAD/CAM 集成 系统 ,适合 于 
CAD/CAM .计算 机 集成 制造 (CIMD) 等 工程 应 用 领域 。 


9.4.2 工程 数据 库 体系 结构 


工程 应 用 领域 数据 处 理 量 是 非常 大 的 。 例 如 ,为 了 存储 一 张 机 械 图 或 描述 一 个 零件 的 
形状 ,其 数据 容量 为 几 千 或 几 兆 字 节 数量 级 ,而 现 用 的 工程 图 或 零件 图 的 件数 是 成 千 上 万 
个 。 所 以 ,工程 数据 库 的 规模 也 许 要 几 千 兆 字 节 至 几 万 兆 字 节 。 对 于 设计 者 来 说 ,希望 有 高 
速 的 响应 时 间 。 设 计 过 程 是 一 个 不 断 摸索 的 过 程 , 有 时 要 利用 前 面 设计 步骤 的 中 间 设 计数 


据 ,再 次 尝试 改进 。 

为 了 较 好 地 满足 工程 设计 中 的 特殊 要 求 , 工 程 数 据 库 可 采用 多 层 结构 。 多 层 结 构 就 是 

把 工程 数据 库 从 逻辑 上 分 为 全 局 数据 库 和 局 部 数据 库 , 如 图 9-6 所 示 。 
局 部 数据 库 全 局 数据 库 

与 设计 有 关 的 数据 
被 要 求 的 数据 


设计 开始 


设计 结束 有 
设计 后 数据 | 起 受 了 影响 的 数据 


图 9-6 局 部 数据 库 和 全 局 数据 库 


全 局 数据 库存 储 公用 数据 、 产 品 和 零 部 件数 据 、 材 料 特性 和 机 械 数据 等 。 这 些 数据 在 企 
业内 为 标准 数据 ,提供 给 产品 设计 ,并 可 在 逻辑 上 和 物理 上 按 工程 应 用 细 分 。 

局 部 数据 库 是 设计 者 独 有 的 临时 性 的 数据 库 , 仅 存储 与 当前 设计 任务 有 关 的 数据 , 当 设 
计 任 务 结束 后 , 库 中 的 数据 不 再 保留 。 但 是 ,在 数据 清除 之 前 ,将 设计 结果 的 数据 送 回 全 局 
数据 库 ,以 便 下 次 操作 时 能 利用 本 次 设计 的 结果 。 

当 一 个 设计 者 开始 设计 时 ,要 初始 化 他 的 局 部 数据 库 。 根 据 设 计 者 要 求 , 将 用 到 的 数据 
从 全 局 数据 库 中 取出 , 存 到 局 部 数据 库 。 为 了 支持 反复 摸索 的 过 程 , 诸 如 设计 处 理 顺序 和 设 
计 处 理 的 中 间 结 果 数 据 , 均 被 保存 在 局 部 数据 库 ,使 得 设计 者 能 把 当前 的 设计 结果 与 以 往 的 
设计 结果 进行 比较 ,做 出 评价 ,也 可 以 从 以 前 的 设计 步骤 开始 再 次 尝试 改进 。 

工程 数据 库 管理 系统 的 体系 结构 可 采用 集中 式 的 结构 、 客 户 端 / 服 务 器 结构 以 及 分 布 式 
结构 。 在 客户 端 / 服 务 器 结构 中 ,全 局 数据 库存 于 服务 器 端 , 局 部 数据 库存 于 客户 端 。 而 在 
分 布 式 结构 中 可 在 某 一 场地 存放 全 局 数据 库 , 其 他 场地 存放 各 自 的 局 部 数据 库 。 


9.4.3 长 事务 管理 


工程 设计 与 传统 数据 库 的 处 理 不 同 , 其 设计 过 程 是 交互 完成 的 ,一 个 事务 将 可 能 会 持续 
很 长 时 间 ,工程 设计 需要 长 事务 管理 。 长 事务 指 的 是 那些 持续 事件 长 的 事务 ,典型 的 长 事务 
其 持续 时 间 从 几 个 小 时 到 几 天 不 等 。 

传统 事务 模型 在 处 理 长 事务 时 会 遇 到 两 个 主要 问题 : 如 发 生 冲 突 则 用 户 对 数据 库 的 访 
问 将 处 于 长 时 间 等 待 状态 ; 若 系统 故障 或 事务 异常 中 止 时 将 撤销 事务 期 间 所 做 的 所 有 操 
作 。 为 了 解决 这 两 个 问题 ,需要 对 长 事务 采用 不 同 于 一 般 事务 的 管理 策略 。 一 般 的 方法 是 
将 长 事务 划分 为 由 一 组 短 事务 组 成 , 短 事务 作为 并 发 控制 和 恢复 的 基本 单元 。 对 短 事务 的 
处 理 可 以 放宽 可 串 行 性 限制 ,而 对 长 事务 的 恢复 必要 时 也 可 以 做 部 分 撤销 。 

目前 ,在 解决 长 事务 等 待 方面 可 采用 的 方法 有 版 本 化 法 、 成 组 事务 、 软 锁 等 几 种 技术 。 

1. 对 象 版 本 化 

当 一 个 对 象 更 新 时 从 共享 数据 库 中 读 出 ,更 新 后 再 送 回 共 享 数据 库 。 如 果 对 象 是 不 可 
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版 本 化 的 ,更 新 后 的 对 象 将 取代 原来 的 对 象 , 这 将 使 其 他 以 冲突 方式 请 求 访问 这 个 对 象 的 事 
务 长 时 间 等 待 。 如 果 一 个 对 象 是 可 版 本 化 的 ,更 新 后 的 对 象 将 作为 一 个 新 的 版 本 送 回 到 共 
享 数据 库 ,这 将 意味 着 对 版 本 化 对 象 的 读 写 不 需要 长 时 间 等 待 。 版 本 化 机 制 允 许 用 户 在 设 
计 过 程 中 使 用 对 象 的 不 同 版 本 ,管理 对 象 的 状态 和 创建 历史 。 但 为 了 减少 管理 和 存储 开销 ， 
应 控制 对 象 版 本 数 。 

2. 模式 版 本 化 

不 但 对 象 可 以 有 多 个 版 本 ,模式 也 有 多 个 版 本 。 这 主要 是 由 于 一 次 要 建立 复杂 的 工程 
数据 实体 的 模型 几乎 是 不 可 能 的 ,必须 不 断 地 接受 用 户 的 反馈 信息 改进 设计 方案 ,因而 要 对 
模式 加 以 修改 。 但 修改 前 的 版 本 对 模式 间 的 比较 、 优 化 是 很 有 用 的 ,因此 工程 数据 库 必须 支 
持 模 式 的 版 本 化 。 模 式 的 版 本 化 可 以 使 用 户 以 不 同 的 角度 看 待 数据 库 , 同 时 版 本 化 的 多 个 
模式 使 得 用 户 对 模式 的 竞争 分 散 到 了 模式 的 不 同 版 本 上 ,减少 了 对 模式 的 操作 等 待 时 间 。 

3. 成 组 事务 

成 组 事务 管理 中 将 一 组 事务 作为 一 个 事务 对 待 , 这 组 事务 可 以 是 由 不 同 用 户 事务 组 成 
的 ,组 内 事务 间 不 会 发 生 冲 突 。 因 此 ,紧密 协作 的 一 组 用 户 可 以 不 受 并 发 控制 的 影响 而 进行 
操作 。 当 与 其 他 组 事务 发 生 冲 突 或 故障 时 成 组 事务 的 任 一 用 户 都 可 以 随时 终止 成 组 事务 。 

4. 非 一 致 性 约束 

传统 数据 库 中 的 事务 具有 一 致 性 ,但 工程 数据 库 的 长 事务 中 允许 子 事务 处 理 的 对 象 是 
不 一 致 的 。 因 长 事务 中 处 理 的 数据 可 能 是 用 户 未 提交 的 ,在 这 期 间 事 务 可 能 中 止 ; 而 多 个 
用 户 的 合作 也 可 能 在 事务 提交 前 交换 数据 。 但 当 数据 送 回 到 共享 数据 库 中 时 将 进行 一 致 性 
检查 。 这 种 不 一 致 性 使 得 用 户 能 够 读 取 被 其 他 用 户 更 新 的 对 象 而 减少 等 待 时 间 。 

5. 软 锁 

软 锁 是 一 种 可 以 通过 用 户 的 谈判 打开 的 锁 。 长 事务 管理 中 有 长 锁 和 短 锁 , 短 锁 是 系统 
自动 设置 的 , 锁 要 持续 到 读 写 操作 结束 或 事务 结束 才能 释放 。 长 锁 是 由 用 户 显 式 设置 的 , 直 
到 长 事务 结束 前 一 直 有 效 ,但 长 锁 可 在 短 事务 中 被 显 式 释 放 。 在 含有 软 锁 的 封锁 协议 中 , 短 
锁 可 以 转换 为 长 锁 , 一 种 方法 是 通过 用 户 显 式 转换 , 另 一 种 方法 是 当 短 锁 在 所 声明 的 时 间 外 
仍然 有 效 时 系统 自动 进行 转换 。 长 锁 也 可 以 通过 显 式 说 明 转 换 为 短 锁 ,但 不 能 够 由 系统 自 
动 进行 转换 。 


9.5 其 他 数据 库 


9.5.1 模糊 数据 库 


模糊 数据 库 指 能 够 处 理 模 糊 数 据 的 数据 库 。 传 统 的 数据 库 仅 允许 对 精确 的 数据 进行 存 
储 和 处 理 , 不 能 表示 许多 模糊 不 清 的 事情 ,而 客观 世界 中 有 许多 事物 是 不 精确 的 ,模糊 数据 
库 的 研究 与 实践 就 是 为 了 解决 模糊 数据 的 表达 和 处 理 问 题 ,使 得 数据 库 描述 的 模型 能 更 自 
然 、 更 贴切 地 反映 客观 世界 。 

因此 , 随 着 模糊 数学 理论 体系 的 建立 ,人 们 可 以 用 数量 来 描述 模糊 事件 并 能 进行 模糊 运 
算 。 这样 就 可 以 把 不 完全 性 ,不 确定 性 、 模 糊 性 引入 数据 库 系统 中 ,从 而 形成 模糊 数据 库 。 
模糊 数据 库 研 究 主要 有 两 方面 ,首先 是 如 何在 数据 库 中 存放 模糊 数据 ; 其 次 是 定义 各 种 运 


算 建立 模糊 数据 上 的 函数 。 模 糊 数 的 表示 主要 有 模糊 区 间 数 、 模 糊 中 心 数 、 模 糊 集合 数 和 隶 
属 函 数 等 。 

在 一 般 数 据 库 系统 中 引入 “模糊 ”概念 产生 了 模糊 数据 库 系 统 。 它 对 模糊 数据 数据 间 
的 模糊 关系 和 模糊 约束 ,实施 模糊 查询 和 模糊 数据 操作 。 客 观 世 界 的 不 完全 性 、 不 确定 性 和 
概念 外 延 的 模糊 性 ,强烈 要 求 寻找 处 理 有 关 模 糊 问题 的 数学 工具 。1965 年 ,L. A. Zadeh 先 
生 的 模糊 集合 理论 应 运 而 生 。 该 理论 的 提出 ,几乎 对 所 有 的 数学 分 支 都 产生 了 重要 影响 ,应 
用 遍及 各 个 领域 ,在 数据 库 理论 与 技术 中 使 用 模糊 理论 。1979 年 ,Buckles 等 人 建立 了 模糊 
关系 数据 库 (FROB) 理 论 , 而 国际 上 对 模糊 数据 库 的 研究 主要 是 从 20 世纪 80 年 代 开 始 的 ， 
旨 在 克服 传统 数据 库 难 以 表达 和 处 理 模糊 信息 的 特点 ,进而 扩展 数据 库 的 功能 ,Zemankova 
以 及 Raju 和 Majumdar(1988) 进 行 了 大 量 有 关 FROB 的 规范 化 工作 ,其 中 主要 涉及 模糊 数 
据 模 型 与 查询 技术 。 近 年 来 ,也 有 许多 工作 是 对 关系 之 外 的 其 他 数据 模型 进行 模糊 扩展 ,如 
模糊 E-R( 实 体 -关系 )、 模 糊 OODB( 面 向 对 象 数据 库 )、 模 糊 多 媒体 数据 库 等 。 中 国 、 日 本 、 
加 拿 大 法国 、 俄 国 的 科研 人 员 在 模糊 数据 库 的 研究 .开发 与 应 用 系统 的 建立 方面 都 做 了 不 
少 工作 。 但 是 , 摆 在 人 们 面前 的 任务 是 ,如 何 进一步 研究 、 开 发 大 型 适用 的 商业 性 模糊 数据 

当前 模糊 数据 库 系统 的 主要 研究 内 容 包 括 : 模糊 数据 库 的 形式 定义 ; 模糊 数据 库 的 数 
据 模型 (如 属性 值 模糊 的 FVRDM ,元 组 值 模糊 的 FTRDMD) ; 模糊 数据 库 语 言 设 计 ; 模糊 数 
据 库 设 计 方法 及 模糊 数据 库 管 理 系 统 的 实现 等 。 


9.5.2 室 间 数据 库 


空间 数据 库 系 统 是 支持 空间 数据 管理 ,面向 地 理 信息 系 统 、 制 图 、 禹 感 \ 摄 影 测量 、 测 给 
和 计算 机 图 形 学 等 学 科 的 数据 库 系统 。 目 前 ,空间 数据 的 结构 基本 上 可 分 为 两 类 : 型 矢量 
和 栅 格 形式 。 矢 量 表示 与 图 形 要 素 的 常规 表示 一 致 ,具有 数据 量 小 、 精 度 高 、 图 形 操作 处 理 
复杂 的 特点 ; 而 栅 格 形式 的 数据 是 电子 设备 获取 数据 和 显示 数据 的 原始 形式 ,基于 栅 格 的 
图 形 处 理 操作 较 易 实现 ,图 形 精度 与 像 元 分 状 率 有 关 , 分 辩 率 高 则 数据 量 增 大 。 为 解决 精度 
和 数据 量 的 矛盾 ,已 提出 并 研究 了 多 种 数据 结构 ,如 四 分 树 (Quad Tree) 及 其 变种 ,以 及 各 
种 压缩 方法 。 空 间 数据 库 系统 不 仅 要 支持 传统 的 数据 查询 ,而 且 要 支持 基于 空间 关系 的 查 
询 。 为 此 要 解决 好 空间 数据 的 存储 和 组 织 ,建立 合适 的 索引 结构 (如 R 树 ) 等 。 

空间 数据 具有 以 下 特性 。 

(1) 复杂 性 。 一 个 空间 对 象 可 以 由 一 个 点 或 几 千 个 多 边 形 组 成 ,并 任意 分 布 在 空间 中 。 
通常 不 太 可 能 用 一 个 关系 表 , 以 定 长 元 组 存储 这 类 对 象 的 集合 。 这 样 空间 操作 (如 相交 、 合 
并 ) 就 比 标准 的 关系 数据 库 操作 复杂 得 多 。 

(2) 动态 性 。 删 除 和 插入 是 以 更 新 操作 交叉 存储 的 ,这 就 要 求 有 一 个 强壮 的 数据 结构 
完成 对 象 频繁 的 插入 、 更 新 和 删除 等 操作 。 

(3) 海量 化 。 空 间 数据 往往 需要 上 千 兆 甚至 上 万 兆 字 节 的 存储 量 , 要 想 进行 高 效 的 空 
间 操 作 ,二 级 和 三 级 存储 的 集成 是 必 不 可 少 的 。 

(4) 算法 不 标准 。 尽 管 提 出 了 许多 空间 数据 算法 ,但 至 今 没 有 一 个 标准 的 算法 ,空间 算 
子 严重 依赖 于 特定 空间 数据 库 的 应 用 程序 。 

(5) 运算 符 不 闭合 。 例 如 ,两 个 空间 实体 的 相交 ,可 能 返回 一 个 点 集 ` 线 集 或 面 集 。 


数据 府 新 技术 


击 属 蛋 


数据 亩 原理 与 应 用 (MySQL 版 ) 


空间 数据 的 查询 主要 有 以 下 三 种 。 

(1) 临近 查询 。 临 近 查询 是 指 为 找 出 特定 位 置 附近 的 对 象 所 做 的 查询 ,如 找 出 最 近 的 
餐馆 。 
(2) 区 域 查询 。 区 域 查询 是 指 为 找 出 部 分 或 全 部 位 于 指定 区 域内 的 对 象 所 做 的 查询 ， 
如 找 出 城市 中 某 个 区 的 所 有 医院 。 

(3) 针对 区 域 的 交 和 并 的 查询 。 例 如 ,给 出 区 域 信息 ,如 年 降雨 量 和 人 口 密度 ,要 求 查 
询 所 有 年 降雨 量 低 且 人 口 密度 高 的 区 域 。 


9.5.3 统计 与 科学 数据 库 


统计 与 科学 数据 库 系统 是 指 面向 统计 分 析 与 科学 研究 而 建立 的 数据 库 系 统 。 统 计数 据 
库 要 求 能 对 其 中 的 数据 进行 统计 分 析 ,如 求 数据 的 平均 值 . 最 大 值 .最 小 值 .总 和 等 。 统 计数 
据 库 中 的 数据 可 分 为 两 类 , 即 微观 数据 和 宏观 数据 。 前 者 是 个 体 或 具体 事件 的 描述 信息 ,而 
后 者 则 是 综合 统计 数据 , 它 可 以 直接 来 源 于 应 用 领域 ,也 可 以 是 微观 数据 的 分 析 结 果 。 统 计 
数据 库 不 仅 数 据 量 大 ,而 且 数 据 具有 稀 玻 性 、 重 复 性 和 分 布 不 均衡 内容 复杂 术语 繁多 等 特 
点 。 在 安全 性 方面 , 它 还 须 注意 防止 各 种 导出 数据 的 泄密 , 即 防止 有 人 在 合法 的 统计 数据 查 
询 的 基础 上 ,推导 出 无 权 查 看 的 某 个 个 体 的 具体 数据 等 。 

用 于 存储 科技 人 员 在 基础 理论 研究 、 应 用 技术 研究 和 新 方法 的 开发 或 研究 中 积累 的 科 
学 实验 数据 或 模拟 结果 的 科学 数据 库 , 同 样 具有 数据 量 大 数据 稳定 结构 复杂 等 特点 ,根据 
其 不 同 的 内 容 和 用 途 , 科 学 数据 库 可 分 为 文献 数据 库 ,数值 数据 库 和 管理 数据 库 等 。 由 于 统 
计数 据 库 和 科学 数据 库 在 结构 、 特 性 和 应 用 等 方面 的 某 些 相 似 性 ,有 时 将 它们 统称 为 统计 与 
科学 数据 库 (Statistical/Scientific Data Base, SSDB)。 它 与 面向 事务 处 理 的 数据 库 系统 相 
比 ,在 数据 模型 数据 操作 ,存储 结构 、 存 取 方法 和 用 户 接 口 等 许多 方面 ,都 有 一 些 新 的 要 求 ， 
它 的 研究 与 开发 ,将 对 统计 分 析 与 科学 研究 产生 重要 影响 。 


9.5.4 实时 数据 库 


实时 数据 库 是 数据 库 技术 结合 实时 处 理 技术 产生 的 。 它 适用 于 处 理 不 断 更 新 的 快速 变 
化 的 数据 及 具有 时 间 限 制 的 事务 处 理 。 实 时 数据 库 系统 是 开发 实时 控制 系统 ,数据 采集 系 
统 .CIMS 等 的 支撑 软件 。 在 现代 化 企业 中 ,大 量 使 用 实时 数据 库 系统 进行 控制 系统 监控 、 
系统 先进 控制 和 优化 控制 ,并 为 企业 的 生产 管理 和 调度 、 数 据 分 析 、 决 策 支持 及 远程 在 线 浏 
览 提供 实时 数据 服务 和 多 种 数据 管理 功能 。 实 时 数据 库 已 经 成 为 企业 信息 化 的 基础 数据 
平台 。 

研究 人 员 和 希望 利用 数据 库 技术 来 解决 实时 系统 中 的 数据 管理 问题 ,同时 利用 实时 技术 
为 实时 数据 库 提供 时 间 驱 动 调度 和 资源 分 配 算 法 。 然 而 ,实时 数据 库 并 非 是 两 者 在 概念 、 结 
构 和 方法 上 的 简单 集成 ,需要 针对 不 同 的 应 用 需求 和 应 用 特点 ,对 实时 数据 模型 .实时 事务 
调度 与 资源 分 配 策 略 、 实 时 数据 查询 语言 .实时 数据 通信 等 大 量 问 题 做 深入 的 理论 研究 。 实 
时 数据 库 系统 的 主要 研究 内 容 包括 : 实时 数据 库 模 型 .实时 事务 调度 (并 发 控制 、 冲 突 解决 、 
死 锁 等 ) 容错 性 与 错误 恢复 .访问 准 入 控制 ,内存 组 织 与 管理 .I/O 与 磁盘 调度 、 主 内 存 数据 
库 系 统 、 不 精确 计算 问题 放松 的 可 串 行 化 问题 .实时 SQL 事务 的 可 预测 性 。 

实时 数据 库 (Real-Time Data Base,RTDB) 是 数据 和 事务 都 有 定时 特性 或 显 式 的 定时 


限制 的 数据 库 。RTDB 的 本 质 特 征 就 是 定时 限制 。 定 时 限制 可 以 归纳 为 两 类 : 一 类 是 与 事 
务 相 关联 的 定时 限制 ,典型 的 就 是 “截止 时 间 ”; 另 一 类 为 与 数据 相关 联 的 “时 间 一 致 性 ”。 
时 间 一 致 性 则 是 作为 过 去 的 限制 的 一 个 时 间 窗 口 , 它 是 由 于 要 求 数 据 库 中 数据 的 状态 与 外 
部 环境 中 对 应 实体 的 实际 状态 要 随时 一 致 ,以 及 由 事务 存 取 的 各 数据 状态 在 时 间 上 要 一 致 
而 引起 的 。 实 时 数据 库 是 一 个 新 的 数据 库 研 究 领 域 , 它 在 概念 ,方法 和 技术 上 都 与 传统 的 数 
据 库 有 很 大 的 不 同 , 其 核心 问题 是 事物 处 理 既 要 确保 数据 的 一 致 性 ,又 要 保证 事物 的 正确 
性 ,而 它们 都 与 定时 限制 相关 联 。 

实时 数据 库 的 一 个 重要 特性 就 是 实时 性 ,包括 数据 实时 性 和 事务 实时 性 。 数 据 实时 性 
是 现场 IO 数据 的 更 新 周期 ,作为 实时 数据 库 , 不 能 不 考虑 数据 实时 性 。 一 般 数 据 的 实时 性 
主要 受 现场 设备 的 制约 ,特别 是 对 于 一 些 比较 老 的 系统 而 言 ,情况 更 是 这 样 。 事 务实 时 性 是 
指数 据 库 对 其 事务 处 理 的 速度 。 它 可 以 是 事件 触发 方式 或 定时 触发 方式 。 事 件 触发 是 该 事 
件 一 旦 发 生 可 以 立刻 获得 调度 ,这 类 事件 可 以 得 到 立即 处 理 , 但 是 比较 消耗 系统 资源 ; 而 定 
时 触发 是 在 一 定时 间 范 围 内 获得 调度 权 。 作 为 一 个 完整 的 实时 数据 库 , 从 系统 的 稳定 性 和 
实时 性 而 言 ,必须 同时 提供 两 种 调度 方式 。 

针对 不 同行 业 不 同类 型 的 企业 ,实时 数据 库 的 数据 来 源 方式 也 各 不 相同 。 总 的 来 说 , 数 
据 的 主要 来 源 有 DCS 控制 系统 、 由 组 态 软 件 十 PLC 建立 的 控制 系统 、 数 据 采 集 系 统 
(SCADA)、 关 系数 据 库 系统 、 直 接连 接 硬 件 设备 和 通过 人 机 界面 人 工 录 入 的 数据 。 根 据 采 
集 的 方式 方法 可 以 分 为 : 支持 OPC 协议 的 标准 OPC 方式 、 支 持 DDE 协议 的 标准 DDE 通 
信 方 式 ,支持 MODBUS 协议 的 标准 MODBUS 通信 方式 .通过 ODBC 协议 的 ODBC 通信 方 
式 \ 通 过 API 编写 的 专 有 通信 方式 .通过 编写 设备 的 专 有 协议 驱动 方式 等 。 

实时 数据 库 系 统 就 是 针对 实时 应 用 的 特点 和 要 求 , 使 其 事务 和 数据 都 可 以 有 定时 特性 
或 显示 定时 限制 的 数据 库 系 统 。 实 时 应 用 的 特点 表现 在 : 活动 时 间 性 强 , 要 求 在 一 定 的 时 
间或 时 刻 内 接收 存 取 和 处 理 信息 ,并 及 时 做 出 响应 ,二 是 要 处 理 “ 临 时 ”数据 ,这 种 数据 在 一 
定时 间 内 有 效 , 过 时 则 无 意义 。 雷 达 跟 踪 、 指 挥 与 控制 等 军事 应 用 就 是 实时 应 用 的 典型 
例子 。 

近年 来 ,实时 数据 库 系统 得 到 了 数据 库 和 实时 系统 两 个 领域 的 研究 人 员 的 关注 ,数据 库 
工作 者 存在 利用 数据 库 技术 来 解决 实时 系统 中 的 时 间 管 理 问 题 ,实时 系统 研究 者 则 致力 为 
实时 数据 库 系统 提供 时 间 驱 动 调度 和 资源 分 配 算 法 ,实时 数据 库 系统 要 对 数据 库 的 结构 与 
组 织 \ 事 务 模型 的 结构 与 时 限 特 征 、 事 务 的 优先 级 分 配 、 调 度 与 并 发 控制 ,数据 的 时 间 一 致 性 
等 一 系列 问题 进行 深入 的 研究 与 分 析 , 利 用 实时 系统 和 传统 数据 库 系 统 中 的 有 效 技 术 和 方 
法 。 目 前 ,主动 式 实时 数据 库 和 分 布 式 实时 数据 库 技术 也 成 为 新 的 数据 库 研 究 方 向 ,预示 着 
实时 数据 库 系统 有 很 好 的 应 用 前 景 。 


9.5.5 内 存 数据 库 


内 存 数 据 库 (Main Memory Database, MMD) 是 指 一 种 将 全 部 内 容 存 放 在 内 存 中 ,而 非 
像 传 统 数据 库 那样 存放 在 外 部 存储 器 中 的 数据 库 。 内 存 数据 库 与 磁盘 数据 库 相 比 ,磁盘 数 
据 库 虽 然 也 有 一 定 的 缓存 机 制 ,但 是 不 能 避免 从 外 部 设备 到 内 存 的 交换 ,而 这 种 交换 过 程 造 
成 磁盘 数据 库存 储 效率 的 下 降 。 由 于 内 存 的 读 写 速度 极 快 ,随机 访问 时 间 可 以 以 纳 秒 计 , 所 
以 ,这 种 数据 库 的 读 写 性 能 很 高 ,主要 针对 性 能 要 求 极 高 的 环境 。 
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内 存 数 据 库 抛弃 了 磁盘 数据 管理 的 传统 方式 ,基于 全 部 数据 都 在 内 存 中 重新 设计 了 体 
系 结构 ,并 且 在 数据 缓存 ,快速 算法 .并 行 操 作 方 面 也 进行 了 相应 的 改进 ,所 以 数据 处 理 速 度 
比 传统 数据 库 的 数据 处 理 速 度 要 快 很 多 ,一 般 都 在 10 倍 以 上 。 内 存 数据 库 的 最 大 特点 是 其 
“ 主 拷 贝 ” 或 “工作 版 本 ” 常 驻 内 存 , 即 活动 事务 只 与 实时 内 存 数据 库 的 内 存 拷贝 打交道 。 

内 存 数据 库 的 历史 可 以 追溯 到 20 世纪 60 年 代 末 。1969 年 ,IBM 公式 研制 的 层次 管理 
系统 IMS 提供 了 两 种 数据 管理 方法 ,一 种 支持 磁盘 存储 , 另 一 种 就 是 基于 内 存 存储 。 这 是 
内 存 数据 库 的 最 早 形 式 。 但 这 一 时 期 的 内 存 容 量 小 ,硬件 成 本 高 ,因此 内 存 数据 库 主要 作为 
嵌入 式 系统 或 者 磁盘 数据 库 辅 助 存储 设备 。1984 年 ,D.J. De Witt 等 人 第 一 次 提出 了 内 存 
数据 库 的 概念 。 之 后 内 存 数据 库 经 历 了 研究 发 展期 和 产品 成 长 期 ,不 断 得 到 丰富 和 完善 , 概 
括 来 说 ,内 存 数据 库 技术 可 以 概括 为 以 下 三 个 层次 。 

(1) 第 一 代 : 用 户 定制 的 内 存 数据 库 。 通 过 应 用 程序 来 管理 内 存 和 数据 ; 不 支持 SQL 
语句 , 不 提供 本 地 存储 , 没有 数据 库 恢复 技术 ; 性 能 好 但 很 难 维护 和 在 别 的 应 用 中 不 能 使 
用 ; 应 用 在 实时 领域 ,比如 工厂 自动 化 生产 。 

(2) 第 二 代 : 简单 功能 的 内 存 数 据 库 。 能 够 快速 处 理 简 单 的 查询 ; 支持 部 分 SQL 请 句 
和 简单 的 恢复 技术 ; 主要 目的 是 能 够 快速 处 理 大 量 事务 ; 针对 简单 事务 处 理 领域 ,尤其 是 
交换 机 ,移动 通信 等 。 

(3) 第 三 代 : 通用 的 内 存 数据 库 。 针 对 传统 的 商业 关系 型 数据 库 领 域 ,能 够 提供 更 高 
的 性 能 、 通 用 性 以 及 稳定 性 ; 提供 不 同 的 接口 来 处 理 复杂 的 SQL 语句 和 满足 不 同 的 应 用 领 
域 ; 可 以 应 用 在 计 费 .电子 商务 ,在线 安全 领域 ,几乎 包括 磁盘 数据 库 的 所 有 应 用 领域 。 

伴随 着 互联 网 的 普及 和 飞速 发 展 ,高 性 能 、 高 并 发 的 应 用 需求 成 为 推动 内 存 数据 库 技 术 
发 展 的 巨大 动力 ,同时 内 存 设备 性 能 的 提升 及 价格 的 降低 ,也 为 内 存 数 据 库 的 实现 提供 了 硬 
件 支撑 。 发 展 针对 大 数据 实时 分 析 处 理 任务 的 分 析 型 内 存 数 据 库 ,以 列 存储 与 混合 存储 、 多 
核 并 行 处 理 、 复 杂 分 析 查 询 处 理 为 特点 ,为 用 户 提供 秒 级 分 析 处 理 能 力 , 成 为 当前 大 数据 环 
境 下 对 内 存 数据 库 应 用 的 新 要 求 。 目 前 ,业界 主流 的 内 存 数据 库 有 eXtremeDB、 Apache 
Ignite ,FastDB、SQLite, Redis&.Memcached 等 。 


9.6 大 数据 管理 技术 


9.6.1 什么 是 大 数据 


2008 年 9 月 ,Science 发 表 了 一 篇 文章 Big Data : Science in the Petabyte Era “大 数 
据 ? 这 个 词 开 始 广泛 传播 。 当 前 ,人 们 从 不 同 的 角度 对 大 数据 进行 了 定义 。 例 如 ,一 般 意义 
上 ,大 数据 是 指 无 法 在 可 容忍 的 时 间 内 用 现 有 IT 技术 和 软 硬 件 工具 对 其 进行 感知 .获取 、 
管理 ,处 理 和 服务 的 数据 集合 。 又 例如 ,大 数据 通常 是 PB(10;TB) 或 EB(10*TB) 或 更 高 数 
量 级 的 数据 ,包括 结构 化 的 、 半 结构 化 的 和 非 结构 化 的 数据 。 其 规模 或 复杂 程度 超出 了 传统 
数据 库 和 软件 技术 所 能 够 管理 和 处 理 的 数据 集 范围 。 再 例如 ,大 数据 指 无 法 在 一 定时 间 范 
围 内 用 常规 软件 工具 进行 捕捉 ,管理 和 处 理 的 数据 集合 ,是 需要 新 处 理 模式 才能 具有 更 强 的 
决策 力 .洞察 发 现 力 和 流程 优化 能 力 的 海量 、 高 增长 率 和 多 样 化 的 信息 资产 。 


9.6.2 大 数据 的 特点 


通常 认为 大 数据 具有 5V 特点 , 即 Volume( 容 量 )、Velocity (速度 )、Variety( 多 样 性 )、 
Veracity( 真 实 性 )\ Value( 价 值 ) 。 

(1) 容量 。 容 量 指 被 大 数据 解决 方案 所 处 理 的 数据 量 大 ,并 且 在 持续 增长 。 数 据 容 量 
大 会 影响 数据 的 独立 存储 和 处 理 需 求 , 同 时 还 会 对 数据 准备 .数据 恢复 .数据 管理 等 操作 产 
生 影响 。 

(2) 速度 。 在 大 数据 环境 中 ,数据 产生 得 很 快 ,在 极 短 的 时 间 内 就 能 聚集 起 大 量 的 数 
据 。 处 理 快速 的 数据 输入 流 , 需 要 设计 出 弹性 的 数据 处 理 方案 ,同时 也 需要 强大 的 数据 存储 
能 力 。 典 型 的 高 速 大 数据 产生 示例 如 一 分 钟 可 以 生成 下 列 数据 : 35 万 条 推 文 .300 小 时 的 
YouTube 视频 、1.71 亿 份 电子 邮件 ,以 及 330GB 飞机 引擎 的 传感器 数据 。 

(3) 多 样 性 。 数 据 多 样 性 是 指 大 数据 解决 方案 需要 支持 不 同 格式 、 不 同类 型 的 数据 。 
不 同 的 数据 格式 包括 : 文本 数据 、 图 像 数 据 、 视 频数 据 、 音 频数 据 、 传 感 器 数据 等 。 主 要 的 数 
据 类 型 包括 : 结构 化 数据 、 半 结构 化 数据 、 非 结构 化 数据 及 元 数据 。 

(4) 真实 性 。 数 据 真 实 性 指数 据 的 质量 和 保 真 性 。 进 入 大 数据 环境 的 数据 需要 确保 质 
量 ,这 样 可 以 使 数据 处 理 消除 掉 不 真实 的 数据 和 噪声 。 品 声 数据 是 无 法 转换 为 信息 与 知识 
的 ,因此 它们 没有 价值 。 信 噪 比 越 高 的 数据 ,真实 性 越 高 。 

(5) 价值 。 数 据 的 价值 是 指数 据 的 有 用 程度 。 价 值 特征 直观 地 与 真实 性 特征 相关 联 ， 
真实 性 越 高 ,价值 越 高 。 同 时 ,价值 也 依赖 于 数据 处 理 时 间 ,因为 分 析 结 果 具 有 时 效 性 。 

针对 大 数据 所 具有 的 上 述 5 个 典型 特征 ,传统 关系 数据 库 技 术 无 法 有 效 解 决 其 存储 、 管 
理 及 查询 处 理 等 需求 ,因而 催生 了 大 量 的 大 数据 平台 及 相关 技术 ,9. 6. 3 节 将 具体 解释 这 个 
问题 。 


9.6.3 传统 关系 型 数据 库 面 临 的 问题 


传统 关系 型 数据 库 在 计算 机 数据 管理 的 发 展 史上 是 一 个 重要 的 里 程 碑 , 这 种 数据 库 具 
有 数据 结构 化 、 元 余 度 低 、 较 高 的 独立 性 以 及 易于 扩充 及 编写 应 用 程序 等 优点 ,目前 较为 成 
熟 的 信息 系统 都 是 建立 在 关系 数据 库 设计 之 上 的 。 

传统 关系 型 数据 库 在 数据 存储 上 主要 面向 结构 化 数据 ,聚焦 于 便捷 的 数据 查询 分 析 能 
力 、 按 照 严格 规则 快速 处 理事 务 的 能 力 、 多 用 户 并 发 访问 能 力 及 数据 安全 性 的 保证 。 但 是 面 
向 结构 化 数据 存储 的 关系 型 数据 库 已 经 不 能 满足 当今 互联 网 数据 快速 访问 .大 规模 数据 分 
析 挖 掘 的 需求 。 具 体 体现 在 下 述 方面 。 

(1) 关系 模型 束缚 对 海量 数据 的 快速 访问 能 力 。 关 系 模型 是 一 种 按照 内 容 访问 的 模 
型 , 即 在 传统 关系 数据 库 中 ,根据 列 的 值 来 定位 相应 的 行 。 这 种 访问 模型 ,会 在 数据 访问 过 
程 中 引入 耗 时 的 输入 /输出 ,从 而 影响 快速 访问 的 能 力 。 虽 然 传统 的 数据 库 系统 可 以 通过 分 
区 技术 (水 平分 区 和 垂直 分 区 ) 来 减少 查询 过 程 中 数据 输入 /输出 的 次 数 以 减少 相应 时 间 , 提 
高 数据 处 理 能 力 ,但 是 在 海量 数据 的 规模 下 ,这 种 分 区 所 带 来 的 性 能 改善 并 不 显著 。 

(2) 缺乏 海量 数据 访问 灵活 性 。 在 现实 情况 中 ,用 户 在 查询 时 希望 具有 极 大 的 灵活 性 。 
用 户 可 以 提 任 何 问题 ,可 以 针对 任何 数据 提问 题 ,可 以 在 任何 时 间 提 问题 。 无 论 提 的 是 什么 
问题 ,都 能 快速 得 到 回答 。 传 统 数据 库 不 能 提供 灵活 的 解决 方法 ,不 能 随机 性 地 查询 并 做 出 
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快速 响应 ,因为 它 需 要 等 待 系统 管理 人 员 对 特殊 查询 进行 调 优 ,这 导致 很 多 公司 不 具备 这 种 
快速 反映 能 力 。 

(3) 对 非 结构 化 数据 处 理 能 力 薄 弱 。 传 统 的 关系 型 数据 库 对 数据 类 型 的 处 理 只 局 限于 
数字 、 字 符 等 ,对 多 媒体 信息 的 处 理 只 是 停留 在 简单 的 二 进 制 代码 文件 的 存储 。 然 而 , 随 着 
用 户 应 用 需求 的 提高 .硬件 技术 的 发 展 和 Internet 提供 的 丰富 的 多 媒体 交流 方式 ,用 户 对 多 
媒体 处 理 的 要 求 从 简单 的 存储 上 升 为 识别 .检索 和 深入 加 工 ,因此 ,如 何 处 理 占 信息 总 量 
85% 的 声音 ,图像 时 间 序 列 信 号 ,视频 、E-mail 等 复杂 数据 类 型 ,是 很 多 数据 库 厂家 面临 的 
难题 。 


9.6.4 NoSQL 数据 库 


针对 关系 数据 库 技术 在 存储 ,管理 及 分 析 处 理 大 数据 时 存在 的 不 适用 性 ,NoSQL 数据 
库 技术 应 运 而 生 。NoSQL 指 的 是 用 于 研发 下 一 代 具 有 高 扩展 性 和 容错 性 的 非 关系 型 数据 
库 技术 。 

NoSQL(Not-only SQL) 数 据 库 是 一 个 非 关系 型 数据 库 , 具 有 高 度 的 可 扩展 性 、 容 错 性 ， 
并 且 专门 设计 用 来 存储 半 结 构 化 和 非 结构 化 数据 。NoSQL 数据 库 通 常会 提供 一 个 能 被 应 
用 程序 调用 的 基于 API 的 查询 接口 。NoSQL 数据 库 也 支持 SQL 以 外 的 查询 语言 ,因为 
SQL 是 为 了 查询 存储 在 关系 型 数据 库 中 的 结构 化 数据 而 设计 的 。 例 如 ,优化 一 个 NoSQL 
数据 库 用 来 存储 XML 文件 通常 会 使 用 XQuery 作为 查询 语言 。 同 样 ,设计 一 个 NoSQL 数 
据 库 用 来 存储 RDF 数据 将 使 用 SPARQL 来 查询 它 包 含 的 关系 。 

根据 不 同 存储 数据 的 方式 ,NoSQL 存储 可 以 分 为 4 种 类 型 ,分 别 是 : 列 式 数据 库 、 键 - 
值 数 据 库 .文档 数据 库 和 图 数据 库 。 

1. 列 式 数据 库 

列 式 数 据 库 将 数据 存储 在 列 族 中 ,一 个 列 族 存 储 经 常 是 被 一 起 查询 的 相关 数据 ,例如 和 人 
类 ,经 常会 查询 某 个 人 的 姓名 和 出 生年 份 ,而 不 是 家 庭 住址 。 这 种 情况 下 ,姓名 和 年 龄 会 放 
到 一 个 列 族 中 ,家 庭 住 址 会 被 放 到 另 一 个 列 族 中 , 见 图 9-7。 这 种 数据 库 通常 用 来 应 对 分 布 
式 存储 海量 数据 。 典 型 的 列 式 数据 库 是 HBase。 


1 1 
1_Personid |! 1Personal details 山 address 
Pd 小 姓名 ， 李 明 小 省份: 江苏 ! 

l 路/ 性别: 男 小 城市 : 徐州 | 

行 | 小 出 生年 份 : 2000 “山区 : 泉山 区 | 
sa 中 姓 名 : 王 和 外 过 份 * 江 节 | 

， 中 性别: 男 小城 市 : 徐州 ! 

3 小 出 生年 份 : 2001 “小 区 : yunlong 区 1 

[ 人 | lss 1 

| ! | 


nl 


图 9-7 列 式 数据 存储 举例 


列 存储 提供 快速 数据 访问 .并 带 有 随机 读 写 能 力 。 它 们 把 列 簇 存 储 在 不 同 的 物理 文件 
中 ,这 将 会 提高 查询 响应 速度 ,因为 只 有 被 查询 的 列 簇 才 会 被 搜索 到 。 


2. 键 - 值 (Key-Value) 数 据 库 

键 - 值 数 据 库 类 似 于 传统 语言 中 使 用 的 哈 希 表 。 可 以 通过 键 值 来 添加 \ 查 询 或 者 删除 数 
据 库 ,因为 使 用 键 值 访问 ,会 获得 很 高 的 性 能 及 扩展 性 。 键 值 数据 存储 中 的 表 是 一 个 值 列 
表 , 其 中 每 个 值 由 一 个 键 来 标识 。 值 对 数据 库 不 透明 且 通 常 以 BLOB 形式 存储 ,存储 的 值 
可 以 是 任何 从 传感器 数据 到 视频 数据 的 集合 。 

键 - 值 存 储 通 过 键 值 查找 ,因为 数据 库 对 存储 的 数据 集合 的 细节 是 未 知 的 。 同 时 ,更 新 
操作 只 能 是 删除 或 者 插入 。 键 - 值 存储 通常 不 含有 任何 索引 ,所 以 写 和 非常 快 , 且 高 度 可 扩 
展 。 一 个 键 - 值 存储 的 例子 见 图 9-8。 典 型 的 键 - 值 数据 库 包括 Mencached、Redis。 


Key Value 

631 Mary ,10.1.23.12,Good customer service 
365 100011111000011100000111000000111 
198 <CustomerlD>12345</CustomerID> 


9-8” 键 - 值 数据 存储 举例 


3. 文档 数据 库 

文档 数据 库 的 灵感 是 来 自 于 Lotus Notes 办 公 软 件 ,而且 它 同 第 一 种 键 - 值 存储 相 类 
似 。 文 档 导 向 的 数据 库 是 键 - 值 数据 库 的 子 类 ,可 以 看 作 键 - 值 数 据 库 的 升级 版 ,允许 伐 套 键 
值 。 它 们 的 差别 在 于 处 理 数据 的 方式 : 在 键 - 值 数 据 库 中 ,数据 是 对 数据 库 不 透明 的 ; 而 面 
向 文档 的 数据 库 系 统 依赖 于 文件 的 内 部 结构 , 它 获取 元 数据 以 用 于 数据 库 引 擎 进行 更 深层 
次 的 优化 。 虽 然 这 一 差别 由 于 系统 工具 而 不 甚 明 显 , 但 在 设计 概念 上 ,这 种 文档 存储 方式 利 
用 了 现代 程序 技术 来 提供 更 丰富 的 体验 。 

“文档 ”其 实 是 一 个 数据 记录 ,这 个 记录 能 够 对 包含 的 数据 类 型 和 内 容 进 行 “ 自 我 描述 ”。 
XML 文档 .HTML 文档 和 JSON 文档 就 属于 这 一 类 。SequoiaDB 就 是 使 用 JSON 格式 的 
文档 数据 库 , 它 存储 的 数据 如 图 9-9 所 示 。 

{ 
SID” sl 
“NAME” : “SequoiaDB” , 
Tai 
“Office” : “123123” , “Mobile” : “132132132” 
} 


“Addr”: “China, GZ” 
} 


图 9-9 文档 数据 存储 举例 


1) 文档 数据 库 与 关系 型 数据 库 的 区 别 
文档 数据 库 不 同 于 关系 型 数据 库 ,关系 型 数据 库 是 高 度 结构 化 的 ,而 Notes 的 文档 数据 
库 允 许 创 建 许 多 不 同类 型 的 非 结构 化 的 或 任意 格式 的 字段 ,与 关系 型 数据 库 的 主要 不 同 在 
于 , 它 不 提供 对 参数 完整 性 和 分 布 事 务 的 支持 ,但 和 关系 型 数据 库 也 不 是 相互 排斥 的 ,它们 
之 间 可 以 相互 交换 数据 ,从 而 相互 补充 、 扩 展 。 
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2) 文档 数据 库 与 文件 系统 的 区 别 

文档 数据 库 与 20 世纪 50、60 年 代 管 理 数据 的 文件 系统 不 同 , 仍 属于 数据 库 范 畴 。 首 
先 ,文件 系统 中 的 文件 基本 上 对 应 于 某 个 应 用 程序 , 当 不 同 的 应 用 程序 所 需要 的 数据 有 部 分 
相同 时 ,也 必须 建立 各 自 的 文件 ,而 不 能 共享 数据 ,而 文档 数据 库 可 以 共享 相同 的 数据 。 因 
此 ,文件 系统 比 文档 数据 库 数据 元 余 度 更 大 ,更 浪费 存储 空间 , 且 更 难于 管理 维护 。 其 次 , 文 
件 系 统 中 的 文件 是 为 某 一 特定 应 用 服务 的 ,所 以 ,要 想 对 现 有 的 数据 再 增加 一 些 新 的 应 用 是 
很 困难 的 ,系统 不 容易 扩充 。 数 据 和 程序 缺乏 独立 性 。 而 文档 数据 库 具 有 数据 的 物理 独立 
性 和 逻辑 独立 性 ,数据 和 程序 分 离 。 

典型 的 文档 数据 库 包 括 CouchDB、MongoDB, 国 内 也 有 文档 型 数据 库 SequoiaDB。 

4. 图 数据 库 

图 模型 记 为 GCV,E),V 为 节点 (Node) 集 合 ,每 个 节点 具有 若干 属性 ,E 为 边 (Edge) 集 
合 , 也 可 以 具有 若干 属性 。 该 模型 支持 图 结构 的 各 种 基本 算法 ,可 以 直观 地 表达 和 展示 数据 
之 间 的 联系 。 

日 常生 活 中 应 用 关系 数据 模型 需要 表示 多 对 多 关系 时 ,常常 需要 创建 一 个 关联 表 来 记 
录 不 同 实体 的 多 对 多 关系 ,而 且 这 些 关 联 表 常常 不 用 来 记录 信息 。 如 果 两 个 实体 之 间 拥 有 
多 种 关系 ,那么 就 需要 在 它们 之 间 创 建 多 个 关联 表 。 当 实体 之 间 的 联系 类 型 多 样 且 复杂 , 且 
管理 及 处 理 的 对 象 以 关系 为 主 时 ,关系 模型 会 因为 变 得 异常 烦琐 而 不 适用 。 产 生 这 一 现象 
的 原因 在 于 关系 型 数据 库 是 为 实体 建 模 这 一 基础 理念 设计 的 。 该 设计 理念 并 没有 提供 对 这 
些 实体 间 关 系 的 直接 支持 。 在 需要 描述 这 些 实体 之 间 的 关系 时 ,常常 需 要 创建 一 个 关联 表 
以 记录 这 些 数据 之 间 的 关联 关系 ,而 且 这 些 关 联 表 常 常 不 用 来 记录 除外 键 之 外 的 其 他 数据 。 
也 就 是 说 ,这 些 关 联 表 也 仅仅 是 通过 关系 型 数据 库 所 拥有 的 功能 来 模拟 实体 之 间 的 关系 。 
这 种 模拟 导致 了 两 个 非常 糟糕 的 结果 : 数据 库 需 要 通过 关联 表 间 接地 维护 实体 间 的 关系 ， 
导致 数据 库 的 执行 效能 低下 ; 同时 关联 表 的 数量 急剧 上 升 。 

相对 于 关系 数据 库 中 的 各 种 关联 表 , 图 数据 库 中 的 关系 可 以 通过 关系 能 够 包含 属性 这 
一 功能 来 提供 更 为 丰富 的 关系 展现 方式 。 因 此 相 较 于 关系 型 数据 库 , 图 数据 库 的 用 户 在 对 
事物 进行 抽象 时 将 拥有 一 个 额外 的 武器 , 那 就 是 丰富 的 关系 。 

图 数据 库 技术 在 社交 网 络 .知识 图 谱 、 个 性 化 推荐 等 领域 得 到 了 广泛 的 应 用 。 典 型 的 图 
数据 库 包括 Neo4j、AllegroGrap、FlockDB 和 GraphDB。 


9.7 数据 仓库 


随 着 Internet 的 兴起 与 飞速 发 展 ,大 量 的 信息 和 数据 迎面 而 来 。 用 科学 的 方法 去 整理 
数据 ,从 而 从 不 同 视角 对 企业 经 营 各 方面 信息 进行 精确 分 析 、 准 确 判 断 , 比 以 往 更 为 迫切 。 
传统 数据 库 系 统 已 经 无 法 满足 数据 处 理 多 样 化 的 要 求 .人 们 尝试 对 DB 中 的 数据 进行 再 加 
工 , 形 成 一 个 综合 的 .面向 分 析 的 环境 ,以 更 好 地 支持 决策 分 析 , 从 而 形成 了 数据 仓库 技术 
(Data Warehousing, DW) 。 

数据 仓库 技术 就 是 基于 数学 及 统计 学 严谨 逻辑 思维 并 达成 “科学 的 判断 、 有 效 的 行为 ” 
的 一 个 工具 。 数 据 仓库 技术 也 是 一 种 达成 “数据 整合 .知识 管 理 ” 的 有 效 手段 。 


9.7.1 什么 是 数据 仓库 
目前 ,“ 数 据 仓库 ”一 词 尚 没有 一 个 统一 的 定义 ,著名 的 数据 仓库 专家 W. H. Inmon 在 其 


著作 Building the Data Warehouse 一 书 中 给 予 如 下 描述 : 数据 仓库 (Data Warehouse) 是 一 
个 面向 主题 的 (Subject Oriented) ,集成 的 (Integrate) 、 相 对 稳定 的 (Non-Volatile) ,反映 历 
史 变 化 (Time Variant) 的 数据 集合 ,用 于 支持 管理 决策 。 对 于 数据 仓库 的 概念 可 以 从 两 个 
层次 予以 理解 。 首 先 ,数据 仓库 用 于 支持 决策 ,面向 分 析 型 数据 处 理 , 它 不 同 于 企业 现 有 的 
操作 型 数据 库 ; 其 次 ,数据 仓库 是 对 多 个 异 构 的 数据 源 有 效 集成 ,集成 后 按照 主题 进行 了 重 
组 ,并 包含 历史 数据 ,而且 存放 在 数据 仓库 中 的 数据 一 般 不 再 修改 。 

根据 数据 仓库 概念 的 含义 ,数据 仓库 拥有 以 下 4 个 特点 。 

(1) 面向 主题 。 主 题 是 一 个 抽象 的 概念 ,是 指 用 户 使 用 数据 仓库 进行 决策 时 所 关心 的 
重点 方面 ,一 个 主题 通常 与 多 个 操作 型 信息 系统 相关 。 

(2) 集成 的 。 数 据 仓 库 中 的 数据 是 在 对 原 有 分 散 的 数据 库 数据 抽取 、 清 理 的 基础 上 经 
过 系统 加 工 、 汇 总 和 整理 得 到 的 ,必须 消除 源 数 据 中 的 不 一 致 性 ,以 保证 数据 仓库 内 的 信息 
是 关于 整个 企业 的 一 致 的 全 局 信息 。 

(3) 相对 稳定 。 数 据 仓库 的 数据 主要 供 企业 决策 分 析 之 用 ,所 涉及 的 数据 操作 主要 是 
数据 查询 ,一旦 某 个 数据 进入 数据 仓库 以 后 ,一 般 情况 下 将 被 长 期 保留 ,也 就 是 数据 仓库 中 
一 般 有 大 量 的 查询 操作 ,但 修改 和 删除 操作 很 少 , 通 常 只 需要 定期 的 加 载 、. 刷 新 。 

(4) 反映 历史 变化 。 数 据 仓库 中 的 数据 通常 包含 历史 信息 ,系统 记录 了 企业 从 过 去 某 
一 时 点 (如 开始 应 用 数据 仓库 的 时 点 ) 到 目前 的 各 个 阶段 的 信息 ,通过 这 些 信息 ,可 以 对 企业 
的 发 展 历程 和 未 来 趋势 做 出 定量 分 析 和 预测 。 


9.7.2 数据 仓库 的 体系 结构 
数据 仓库 系统 是 一 个 包含 4 个 层次 的 体系 结构 ,如 图 9-10 所 示 。 


OLAP 服 务 器 前 端 工具 


加 查询 工具 


报表 工具 


分 析 工 具 
[一 "| 


数据 仓库 


抽取 、 清 理 
装载 、 刷 新 


局 人 


数据 源 数据 集 市 


OLAP 服 务 器 
图 9-10 数据 仓库 系统 体系 结构 


1. 数据 源 
数据 源 是 数据 仓库 系统 的 基础 ,是 整个 系统 的 数据 源泉 。 通 常 包 括 企 业内 部 信息 和 外 
部 信息 。 内 部 信息 包括 存放 于 RDBMS 中 的 各 种 业务 处 理 数据 和 各 类 文档 数据 。 外 部 信息 
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包括 各 类 法 律 法 规 , 市 场 信息 和 竞争 对 手 的 信息 等 。 

2. 数据 仓库 

数据 仓库 是 整个 数据 仓库 系统 的 核心 。 数 据 仓库 的 真正 关键 是 数据 的 存储 和 管理 。 数 
据 仓 库 的 组 织 管理 方式 决定 了 它 有 别 于 传统 数据 库 , 同 时 也 决定 了 其 对 外 部 数据 的 表现 形 
式 。 要 决定 采用 什么 产品 和 技术 来 建立 数据 仓库 的 核心 , 则 需要 从 数据 仓库 的 技术 特点 着 
手 分 析 。 针 对 现 有 各 业务 系统 的 数据 ,进行 抽取 、 清 理 ,并 有 效 集成 ,按照 主题 进行 组 织 。 数 
据 仓 库 按照 数据 的 覆盖 范围 可 以 分 为 企业 级 数据 仓库 和 部 门 级 数据 仓库 (通常 称 为 数据 
集 市 ) 。 

3. OLAP 服务 器 

对 分 析 需 要 的 数据 进行 有 效 集成 , 按 多 维 模型 予以 组 织 , 以 便 进行 多 角度 、 多 层次 的 分 
析 ,并 发 现 趋势 。 其 具体 实现 可 以 分 为 : ROLAP、MOLAP 和 HOLAP。ROLAP 基本 数据 
和 聚合 数据 均 存 放 在 RDBMS 之 中 ; MOLAP 基本 数据 和 聚合 数据 均 存放 于 多 维 数据 库 
中 ; HOLAP 基本 数据 存放 于 RDBMS 之 中 ,聚合 数据 存放 于 多 维 数据 库 中 。 

4. 前 端 工具 

主要 包括 各 种 报表 工具 ,查询 工具 数据 分 析 工 具 、 数 据 挖掘 工具 以 及 各 种 基于 数据 仓 
库 或 数据 集 市 的 应 用 开发 工具 。 其 中 ,数据 分 析 工 具 主要 针对 OLAP 服务 器 ,报表 工具 、 数 
据 挖 掘 工 具 主要 针对 数据 仓库 。 


9.7.3 数据 仓库 的 作用 


数据 仓库 主要 有 以 下 三 方面 的 作用 。 

首先 ,数据 仓库 提供 了 标准 的 报表 和 图 表 功 能 ,其 中 的 数据 来 源 于 不 同 的 多 个 事务 处 理 
系统 ,因此 ,数据 仓库 的 报表 和 图 表 是 关于 整个 企业 集成 信息 的 报表 和 图 表 。 

其 次 ,数据 仓库 支持 多 维 分 析 。 多 维 分 析 是 通过 把 一 个 实体 的 多 项 重要 的 属性 定义 为 
多 个 维度 ,使 得 用 户 能 方便 地 汇总 数据 集 , 简 化 了 数据 的 分 析 处 理 逻辑 ,并 能 对 不 同 维度 值 
的 数据 进行 比较 ,而 维度 则 表示 了 对 信息 的 不 同 理解 角度 ,例如 ,时 间 和 地 区 是 经 常 采用 的 
维度 。 应 用 多 维 分 析 可 以 在 一 个 查询 中 对 不 同 的 数据 进行 纵向 或 横向 的 比较 ,这 在 决策 工 
程 中 非常 有 用 。 

第 三 ,数据 仓库 是 数据 挖掘 技术 的 关键 基础 。 

总 之 ,数据 仓库 的 主要 作用 是 通过 多 维 模式 结构 ,快速 分 析 计 算 能 力 和 强大 的 信息 输出 
能 力 为 决策 分 析 提 供 支持 。 


9.8 知识 发 现 


数据 挖掘 是 从 存放 在 数据 库 、 数 据 仓 库 和 其 他 信息 库 中 的 大 量 的 数据 中 挖掘 有 趣 知识 
的 过 程 。 数 据 挖掘 其 实 是 一 个 逐渐 演变 的 过 程 , 电 子 数据 处 理 的 初期 ,人 们 就 试图 通过 某 些 
方法 来 实现 自动 决策 支持 ,当时 机 器 学 习 成 为 人 们 关心 的 焦点 。 随 后 , 随 着 神经 网 络 技术 的 
形成 和 发 展 , 人 们 的 注意 力 转 向 知识 工程 。 知 识 工程 不 同 于 机 器 学 习 那 样 给 计算 机 输入 范 
例 ,让 它 生成 出 规则 ,而 是 直接 给 计算 机 输入 已 被 代码 化 的 规则 ,而 计算 机 是 通过 使 用 这 些 
规则 来 解决 某 些 问题 。20 世纪 80 年 代 , 人 们 又 在 新 的 神经 网 络 理论 的 指导 下 ,重新 回 到 机 


器 学 习 的 方法 上 ,并 将 其 成 果 应 用 于 处 理 大 型 商业 数据 库 。 在 20 世纪 80 年 代 末 出 现 了 一 
个 新 的 术语 ,就 是 数据 库 中 的 知识 发 现 (Knowledge Discovery in Database,KDD) 。 

这 里 所 说 的 知识 发 现 ,不 是 要 求 发 现 放 之 四 海 而 皆 准 的 真理 ,也 不 是 要 去 发 现 崭 新 的 自 
然 科 学 定理 和 纯 数学 公式 ,更 不 是 什么 机 器 定理 证 明 。 实 际 上 ,所 有 发 现 的 知识 都 是 相对 
的 ,是 有 特定 前 提 和 约束 条 件 ,面向 特定 领域 的 ,同时 还 要 能 够 易于 理解 。 最 好 能 用 自然 语 
言 表达 所 发 现 的 结果 。 


9.8.1 KDD 的 相关 概念 


1996 年 ,U. M. Fayyad 给 出 了 目前 公认 的 定义 : KDD 是 从 数据 集中 识别 出 有 效 的 、 新 
颖 的 、 潜 在 有 用 的 ,以 及 最 终 可 理解 的 模式 的 非 平凡 过 程 。 在 上 面 的 定义 中 ,涉及 几 个 需要 
进一步 解释 的 概念 :“ 数 据 集 “ 模 式 “ 过 程 “* 有 效 性 “新 颖 性 “潜在 有 用 性 ”和 “最 终 可 理 

(1) 数据 集 F 是 一 组 事实 (如 关系 数据 库 中 的 记录 ), 它 记录 了 事物 有 关 方 面 的 原始 信 
息 , 如 学 生 档案 数据 .商场 销售 数据 或 者 银行 客户 信息 。 由 于 KDD 处 理 的 数据 是 从 现实 世 
界 中 得 来 的 ,因而 并 不 能 保证 所 有 数据 都 规范 ,一 般 需 要 对 数据 进行 预 处 理 , 使 之 适 于 知识 
提取 。 

(2) 模式 是 用 语言 L 来 表示 的 一 个 表达 式 EE, 它 可 用 来 描述 数据 集 F 的 某 个 子 集 FE,E 
作为 一 个 模式 要 求 它 比 对 数据 子 集 的 枚 举 要 简单 (所 用 的 描述 信息 量 要 少 )。 模 式 可 以 看 作 
是 知识 , 它 给 出 了 数据 的 特性 或 数据 之 间 的 关系 ,是 对 数据 包含 的 信息 更 抽象 的 描述 。 例 
如 ,如 果 对 同一 信用 卡 在 短 时 间 内 连续 使 用 , 则 该 信用 卡 可 能 丢失 而 被 其 他 人 所 资 用; 成 绩 
优秀 的 学 生 学 习 都 是 非常 刻苦 等 。 模 式 的 表示 方式 很 多 ,有 时 甚至 无 法 用 显 式 的 方法 进行 
描述 ,例如 ,利用 神经 网 络 可 以 对 手写 体 汉字 进行 分 类 ,学 习 结果 是 神经 网 络 中 各 个 单元 之 
间 的 连接 权 值 ,模式 是 通过 这 些 连接 权 值 在 使 用 过 程 中 体现 出 来 的 。 

(3) 过 程 在 KDD 中 通常 指 多 阶段 的 一 个 过 程 ,涉及 数据 准备 、 模 式 搜索 、 知 识 评 价 ,以 
及 反复 的 修改 求 精 。 该 过 程 要 求 是 非 平 凡 的 ,意思 是 要 有 一 定 程度 的 智能 性 、 自 动 性 ( 仅 给 
出 所 有 数据 的 总 和 不 能 算 作 一 个 发 现 过 程 ) 。 

(4) 有 效 性 是 指 发 现 的 模式 对 于 新 的 数据 仍 保持 有 一 定 的 可 信和 度 。 

(5) 新 颖 性 要 求 发 现 的 模式 应 该 是 新 的 。 

(6) 潜在 有 用 性 是 指 发 现 的 知识 将 来 有 实际 效用 ,如 用 于 决策 支持 系统 里 可 提高 经 济 
效益 。 

有 效 性 、 新 颖 性 、 潜 在 有 用 性 和 最 终 可 理解 性 综合 在 一 起 可 称 为 兴趣 性 。 通 过 KDD 从 
当前 数据 所 发 现 的 模式 必须 有 一 定 的 正确 程度 和 新 颖 性 ,否则 KDD 就 毫 无 作用 。 虽 然 知 
识 发 现 可 以 对 已 有 的 知识 进行 验证 ,但 发 现 新 的 知识 往往 更 重要 ,或 者 对 已 有 的 知识 进行 
拓展 以 得 到 更 全 面 、 更 具有 实际 意义 的 知识 ,发 现 的 知识 必须 经 过 实践 的 检验 ,并 通过 在 
实际 应 用 中 发 现 的 问题 对 学 习 数 据 和 策略 进行 修改 、 重 新 进行 学 习 从 而 得 到 更 精确 的 知 
识 。 一 般 在 使 用 提取 出 的 知识 之 前 ,要 使 用 一 些 数 据 进 行 测试 ,只 有 测试 结果 达到 要 求 
才能 应 用 。 

(7) 最 终 可 理解 性 要 求 发 现 的 模式 能 被 用 户 理解 ,目前 它 主要 体现 在 简洁 性 上 。KDD 
的 目标 就 是 将 数据 中 隐 含 的 模式 提取 出 来 ,从 而 帮助 人 们 更 好 地 了 解数 据 中 所 包含 的 信息 。 
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但 一 般 知 识 学 习 算 法 得 到 的 模式 对 普通 用 户 来 说 很 难 理解 ,更 不 用 说 使 用 。 因 此 ,KDD 不 
仅 应 该 能 够 将 知识 提取 出 来 ,更 应 该 将 发 现 的 知识 以 直观 易 用 的 方式 呈现 给 用 户 。 当 然 ,一 
个 模式 是 否 容易 被 人 理解 ,这 本 身 就 很 难 衡量 ,往往 需要 按照 用 户 能 够 理解 的 形式 表现 
出 来 。 


9.8.2 KDD 的 基本 任务 


对 于 知识 发 现 技术 的 研究 集中 于 寻求 各 种 问题 的 解决 办 法 ,包括 将 数据 归 为 不 同 的 种 
类 ,刻画 一 组 数据 的 特征 ,发 现 数据 项 之 间 的 关联 和 相关 性 ,发 现 顺 序 模式 及 规则 数据 的 相 
似 性 。 知 识 发 现 的 基本 任务 如 下 。 

(1) 数据 分 类 。 分 类 是 数据 挖掘 研究 的 重要 分 支 之 一 ,是 一 种 有 效 的 数据 分 析 方法 。 
分 类 的 目标 是 通过 分 析 训 练 数据 集 ,构造 一 个 分 类 模型 ( 即 分 类 器 ) ,该 模型 能 够 把 数据 库 中 
的 数据 记录 映射 到 一 个 给 定 的 类 别 , 从 而 可 以 应 用 于 数据 预测 。 

(2) 数据 聚 类 。 当 要 分 析 的 数据 缺乏 必要 的 描述 信息 ,或 者 根本 就 无 法 组 织 成 任何 分 
类 模式 时 ,利用 聚 类 函数 把 一 组 个 体 按照 相似 性 归 成 车 干 类 ,这 样 就 可 以 自动 找到 类 。 聚 类 
和 分 类 类 似 , 都 是 将 数据 进行 分 组 。 但 与 分 类 不 同 的 是 , 聚 类 中 的 组 不 是 预先 定义 的 ,而 是 
根据 实际 数据 的 特征 按照 数据 之 间 的 相似 性 来 定义 的 。 

(3) 衰退 和 预报 。 这 是 一 种 特殊 类 型 的 分 类 ,可 以 看 作 是 根据 过 去 和 当前 的 数据 预测 
未 来 的 数据 状态 。 通 过 对 用 衰减 统计 技术 建 模 的 数字 值 的 预测 ,学 习 一 种 (线性 或 非 线 性 ) 
功能 将 数据 项 映射 为 一 个 数字 预测 变量 。 

(4) 关联 和 相关 性 。 指 发 现 大 规模 数据 集中 项 集 之 间 有 趣 的 关联 或 相关 关系 。 关 联 规 
则 是 指 通过 对 数据 库 中 的 数据 进行 分 析 , 从 某 一 数据 对 象 的 信息 来 推断 另 一 数据 对 象 的 信 
息 , 寻 找 出 重复 出 现 概 率 很 高 的 知识 模式 ,常用 一 个 带 有 置信 度 因 子 的 参数 来 描述 这 种 不 确 
定 的 关系 。 

(5) 顺序 发 现 。 通 常 指 确定 数据 组 中 的 顺序 模式 。 当 数据 的 特定 类 型 的 关系 已 被 发 现 
时 ,这 些 模 式 同 关联 和 相关 性 相似 。 但 对 关系 基于 时 间 序 列 的 数据 组 ,顺序 发 现 和 关联 就 不 
同 了 。 顺 序 发 现 是 将 数据 映射 为 有 关 数 据 组 的 简练 描述 的 子 集 或 映射 为 数据 库 中 一 组 特定 
用 户 数据 的 高 度 概括 的 数据 。 

(6) 描述 和 辨别 。 指 发 现 一 组 特征 规则 ,其 中 的 每 一 条 都 是 或 者 显示 数据 组 的 特征 或 
者 从 对 比 类 中 区 别 实验 类 的 概念 的 命题 。 

(7) 时 间 序 列 分 析 。 其 任务 是 发 现 属性 值 的 发 展 趋 向 ,如 股票 价格 指数 的 金融 数据 、 客 
户 数 据 和 医学 数据 等 。 它 是 用 来 搜寻 相似 模式 以 发 现 和 预测 特定 模式 的 风险 、 因 果 关 系 和 
趋势 。 


9.8.3 KDD 的 处 理 过 程 


知识 发 现 过 程 按 照 描 述 方法 的 不 同 可 以 分 为 : 多 处 理 阶 段 模型 和 以 用 户 为 中 心 的 
模型 。 

1. 多 处 理 阶段 模型 

多 处 理 阶 段 模型 将 数据 库 中 的 知识 发 现 看 作 一 个 多 阶段 的 处 理 过 程 ,在 整个 知识 发 现 
的 过 程 中 包括 很 多 处 理 阶段 。 这 里 主要 介绍 两 种 面向 多 阶段 处 理 过 程 的 KDD 处 理 过 程 模 


型 。 图 9-11 是 Usama M. Fayyad 等 人 给 出 的 处 理 模型 。 


模式 解释 
知识 评价 


图 9-11 Usama M. Fayyad 提出 的 KDD 多 处 理 阶 段 模型 


在 图 9-11 的 处 理 模型 中 ,知识 发 现 过 程 共 分 为 9 个 处 理 阶 段 , 这 9 个 处 理 阶段 分 别 是 
数据 准备 .数据 选择 .数据 预 处 理 ,数据 缩减 .KDD 目标 确定 .挖掘 算法 确定 、 数 据 挖掘 、 模 式 
解释 及 知识 评价 。 

(1) 数据 准备 : 了 解 KDD 相关 领域 的 有 关 情 况 ,熟悉 有 关 的 背景 知识 ,并 和 弄 清楚 用 户 
的 要 求 。 

(2) 数据 选择 : 根据 用 户 的 要 求 从 数据 库 中 提取 与 KDD 相关 的 数据 ,KDD 将 主要 从 
这 些 数 据 中 进行 知识 提取 ,在 此 过 程 中 ,会 利用 一 些 数据 库 操 作对 数据 进行 处 理 。 

(3) 数据 预 处 理 : 主要 是 对 阶段 2 产生 的 数据 进行 再 加 工 ,检查 数据 的 完整 性 及 数据 的 
一 致 性 ,对 其 中 的 噪声 数据 进行 处 理 , 对 丢失 的 数据 可 以 利用 统计 方法 进行 填补 。 

(4) 数据 缩减 : 对 经 过 预 处 理 的 数据 ,根据 知识 发 现 的 任务 对 数据 进行 再 处 理 , 主 要 通 
过 投影 或 数据 库 中 的 其 他 操作 减少 数据 量 。 

(5) 确定 KDD 的 目标 : 根据 用 户 的 要 求 ,确定 KDD 是 发 现 何 种 类 型 的 知识 ,因为 对 
KDD 的 不 同 要 求 会 在 具体 的 知识 发 现 过 程 中 采用 不 同 的 知识 发 现 算法 。 

(6) 挖掘 算法 确定 : 根据 阶段 5 所 确定 的 任务 ,选择 合适 的 知识 发 现 算法 ,这 包括 选取 
合适 的 模型 和 参数 ,并 使 得 知识 发 现 算法 与 整个 KDD 的 评判 标准 相 一 致 。 

(7) 数据 挖掘 : 运用 选 定 的 知识 发 现 算法 ,从 数据 中 提取 出 用 户 所 需要 的 知识 ,这 些 知 
识 可 以 用 一 种 特定 的 方式 表示 或 使 用 一 些 常用 的 表示 方式 ,如 产生 式 规则 等 。 

(8) 模式 解释 : 对 发 现 的 模式 进行 解释 ,在 此 过 程 中 ,为 了 取得 更 为 有 效 的 知识 ,可 能 
会 返回 前 面 处 理 步骤 中 的 某 些 步 以 反复 提取 ,从 而 提取 出 更 有 效 的 知识 。 

(9) 知识 评价 : 将 发 现 的 知识 以 用 户 能 了 解 的 方式 呈现 给 用 户 。 这 期 间 也 包含 对 知识 
的 一 致 性 的 检查 ,以 确信 本 次 发 现 的 知识 不 与 以 前 发 现 的 知识 相抵 触 。 

George H. John 给 出 了 另 一 种 多 阶段 知识 发 现 模 型 ,虽然 在 某 些 地 方 与 上 面 给 出 的 处 
理 模 型 有 一 些 区 别 ,但 这 种 区 别 主 要 表现 在 对 整个 处 理 过 程 的 组 织 和 表达 方式 上 ,在 内 容 上 
两 者 并 没有 非常 本 质 的 区 别 。 
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这 种 模型 强调 由 数据 挖掘 人 员 和 领域 专家 共同 参与 KDD 的 全 过 程 。 领 域 专家 对 该 领 
域内 需要 解决 的 问题 非常 清楚 ,在 问题 的 定义 阶段 由 领域 专家 向 数据 挖掘 人 员 解 释 , 数 据 挖 
据 人 员 将 数据 挖掘 采用 的 技术 及 能 解决 问题 的 种 类 介绍 给 领域 专家 。 双 方 经 过 互相 了 解 ， 
对 要 解决 的 问题 有 一 致 的 处 理 意见 ,包括 问题 的 定义 及 数据 的 处 理 方式 。 

2. 以 用 户 为 中 心 的 处 理 模型 

Brachman & Anand 从 用 户 的 角度 对 KDD 处 理 过 程 进行 了 分 析 。 他 们 认为 数据 库 中 
的 知识 应 该 更 着 重 于 对 用 户 进行 知识 发 现 的 整个 过 程 的 支持 方面 ,而 不 是 仅仅 限于 在 数据 
挖掘 的 一 个 阶段 上 。 通 过 了 解 很 多 KDD 用 户 在 实际 工作 中 遇 到 的 问题 ,他 们 发 现 用 户 的 
很 大 一 部 分 工作 量 能 够 与 数据 库 的 交互 。 因 此 ,他 们 在 开发 数据 挖掘 系统 (Interactive 
Marketing Analysis and Classification System,IMACS) 时 特别 强调 对 用 户 与 数据 库 交 互 
的 支持 。 图 9-12 给 出 了 该 模型 的 框图 。 
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9-12 以 用 户 为 中 心 的 处 理 过 程 模型 


用 户 根 据 数据 库 中 的 数据 ,提出 一 种 假设 模型 ,然后 选择 有 关 数 据 进行 知识 挖掘 ,并 不 
断 对 模型 的 数据 进行 调整 优化 。 整 个 处 理 过 程 分 为 以 下 6 个 步骤 。 

(1) 任务 定义 : 通过 与 用 户 或 用 户 集体 的 多 次 交流 ,明确 了 解 需 要 完成 的 任务 。 任 务 
定义 是 为 了 明确 需要 发 现 的 知识 的 类 别 及 相关 数据 。 

(2) 数据 发 现 : 了 解 任 务 所 涉及 的 原始 数据 的 数据 结构 及 数据 所 代表 的 意义 ,并 从 数 
据 库 中 提取 相关 数据 。 

(3) 数据 清理 : 对 用 户 的 数据 进行 清理 以 使 其 适用 于 后 续 的 数据 处 理 。 这 需要 具备 用 
户 的 背景 知识 ,同时 也 应 该 根据 实际 的 任务 确定 清理 规则 。 

(4) 模型 的 确定 : 通过 对 数据 的 分 析 , 选 择 一 个 初始 的 模型 。 模 型 定义 一 般 分 为 三 个 
步骤 , 即 数据 分 隔 、 模 型 选择 和 参数 选择 。 

(5) 数据 分 析 : 包括 4 个 处 理 阶 段 ,一 是 对 选中 的 模型 进行 详细 定义 ,确定 模型 的 类 型 
及 有 关 属 性 ; 二 是 通过 对 相关 数据 的 计算 ,计算 模型 的 有 关 参 数 ,得 到 模型 的 各 属性 值 ; 三 
是 通过 测试 数据 对 得 到 的 模型 进行 测试 和 评价 ; 四 是 根据 评价 结果 对 模型 进行 优化 。 

(6) 输出 结果 生成 : 数据 分 析 的 结果 一 般 都 比较 复杂 ,很 难 被 人 理解 ,而 将 结果 以 文档 


或 图 表 形 式 表现 出 来 , 则 易于 被 人 接受 。 
该 处 理 过 程 模型 以 用 户 为 中 心 ,通过 对 用 户 在 进行 数据 挖掘 过 程 时 的 工作 方式 的 分 析 ， 
在 设计 KDD 系统 时 更 注重 对 用 户 的 整个 数据 挖掘 的 全 过 程 提 供 支 持 。 


9.8.4 KDD 的 方法 


知识 发 现 领域 充分 体现 了 各 种 方法 论 的 相互 交叉 ,渗透 和 协作 。 知 识 发 现 方法 主要 包 
括 统计 方法 、 机 器 学 习 方 法 、 神 经 网 络 方法 和 数据 库 方法 等 。 

1. 统计 方法 

统计 方法 是 从 事物 的 外 在 数量 上 的 表现 去 推断 该 事物 可 能 的 规律 性 。 统 计 方法 有 如 下 
几 种 。 

(1) 传统 统计 方法 。 传 统 的 统计 方法 所 研究 的 主要 是 渐 近 理论 , 即 当 样本 趋向 于 无 穷 
多 时 的 统计 性 质 。 统 计 方 法 主要 考虑 测试 预想 的 假设 是 否 与 数据 模式 拟 合 。 它 依赖 于 显 式 
的 基本 概率 模式 。 常 用 的 统计 分 析 方法 有 : 判别 分 析 ( 贝 叶 斯 判别 、 费 歇 尔 判 别 、. 非 参数 判 
别 等 )、. 聚 类 分 析 ( 系 统 聚 类 动态 聚 类 等 ) 探索 性 分 析 ( 主 元 分 析 法 、 相 关 分 析 法 等 )、 回 归 分 
析 ( 多 元 回归 、 自 回归 、 偏 最 小 二 乘 回归 等 ) 等 。 

(2) 模糊 集 。 模 糊 集 是 表示 和 处 理 不 确定 性 数据 的 重要 方法 。 模 糊 集 不 仅 可 以 处 理 不 
完全 数据 .噪声 或 不 精确 数据 ,而 且 在 开发 数据 的 不 确定 性 模型 方面 是 有 用 的 ,能 提供 比 传 
统 方法 更 灵巧 、 更 平滑 的 性 能 。 

(3) 粗糙 集 。 粗 糙 集 理论 是 一 种 智能 决策 分 析 工 具 , 它 是 一 种 刻画 不 完整 性 和 不 确定 
性 的 数学 工具 ,能 有 效 地 分 析 不 精确 不一致, 不 完整 等 各 种 不 完备 的 信息 。 粗 糙 集 常 与 规 
则 归纳 ,分 类 和 聚 类 方法 结合 起 来 使 用 ,很 少 单独 使 用 。 

2. 机 器 学 习 法 

机 器 学 习 是 一 门 研究 机 器 获取 新 知识 和 新 技能 ,并 识别 现 有 知识 的 学 问 。 目 前 较为 常 
用 的 机 器 学 习 方 法 有 如 下 几 种 。 

(1) 规则 归纳 法 。 规 则 反映 数据 项 中 某 些 属性 或 数据 集中 某 些 数据 项 之 间 的 统计 相关 
性 。 典 型 的 关联 规则 挖掘 算法 有 Apriori。 

(2) 决策 树 法 。 决 策 树 是 通过 一 系列 规则 对 数据 进行 分 类 的 过 程 。 决 策 树 方法 利用 训 
练 集 生成 一 个 测试 函数 ,根据 不 同 取 值 建立 树 的 分 支 ;在 每 个 分 支 子 集中 重复 建立 下 层 节 
点 和 分 支 ,这 样 便 生 成 一 棵 决策 树 。 然 后 对 决策 树 进行 剪 枝 处 理 , 最 后 把 决策 树 转 换 为 
规则 ,利用 这 些 规则 可 以 对 新 事例 进行 分 类 。 决 策 树 方法 很 难 基于 多 个 变量 组 合 发 现 规 
则 。 不 同 决策 树 分 支 之 间 的 分 裂 也 不 平滑 。 在 信息 缺乏 时 ,决策 树 方法 可 能 漏 掉 有 价值 
的 规则 。 

(3) 范例 推理 。 范 例 推理 是 直接 使 用 过 去 的 经 验 或 解法 来 求解 给 定 的 问题 。 范 例 常 常 
是 一 种 已 经 遇 到 过 并 且 有 解法 的 具体 问题 。 当 给 定 一 个 特定 问题 时 ,范例 推理 就 检索 范例 
库 , 寻 找 相 似 的 范例 。 

(4) 贝 叶 斯 信念 网 络 。 贝 叶 斯 信念 网 络 是 概率 分 布 的 图 表示 。 贝 叶 斯 信念 网 络 是 一 种 
直接 的 \ 非 循环 的 图 ,节点 表示 属性 变量 , 边 表示 属性 变量 之 间 的 概率 依赖 关系 。 与 每 个 节 
点 相关 的 是 条 件 概 率 分 布 ,描述 该 节点 与 它 的 父 节点 之 间 的 关系 。 

(5) 遗传 算法 。 遗 传 算法 是 按照 自然 进化 原理 提出 的 一 种 优化 策略 。 在 求解 过 程 中 ， 
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通过 最 优 解 的 选择 和 彼此 组 合 , 则 可 以 期 望 解 的 集合 将 会 愈 来 愈 好 。 在 数据 挖掘 中 ,遗传 算 
法 用 来 形成 变量 间 依 赖 关 系 假设 。 遗 传 算法 是 一 种 优化 技术 , 它 利 用 生物 进化 的 一 系列 概 
念 进行 问题 的 搜索 ,最 终 达 到 优化 的 目的 。 

3. 神经 网 络 法 

神经 网 络 基 于 自学 习 数 学 模型 ,通过 数据 的 编码 及 神经 元 的 迭代 求解 ,完成 复杂 的 模式 
抽取 及 趋势 分 析 功能 。 神 经 网 络 系统 由 一 系列 类 似 于 人 脑 神 经 元 一 样 的 节点 组 成 ,节点 间 
彼此 互 连 ,分 为 输入 层 、 中 间 ( 隐 藏 ) 层 、 输 出 层 。 神 经 网 络 通过 网 络 的 学 习 功 能 得 到 一 个 恰 
当 的 连接 加 权 值 , 较 典 型 的 学 习 方 法 是 BP 法 。 神 经 网 络 系统 具有 非 线性 学 习 、 联 想 记忆 的 
优点 。 神 经 网 络 系统 是 一 个 黑 盒子 ,不 能 观察 中 间 的 学 习 过 程 , 最 后 的 输出 结果 也 较 难 解 
释 ,影响 结 果 的 可 信和 度 及 可 接受 程度 。 需 要 较 长 的 学 习 时 间 , 对 大 数据 量 性 能 出 现 严重 
影响 。 

4. 数据 库 方法 

数据 库 方法 主要 包括 多 维 数据 分 析 或 联机 分 析 处 理 (OLAP) 技 术 , 另 外 还 有 面向 属性 
的 归纳 方法 。OLAP 主要 通过 多 维 的 方式 对 数据 进行 分 析 ,查询 和 报表 。 

目前 ,知识 发 现 被 越 来 越 多 地 应 用 于 过 程控 制 、 信 息 管理 商业、 医疗 金融 等 领域 。 
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本 章 围 绕 数据 管理 对 数据 库 相 关 技术 最 新 的 发 展 趋势 进行 了 介绍 ,包括 数据 库 技术 与 
方法 论 的 结合 ,数据 库 技术 与 其 他 计算 机 技术 或 应 用 领域 的 结合 ,数据库 技术 在 大 数据 时 代 
的 新 发 展 ,以 及 数据 仓库 和 知识 发 现 4 部 分 。 

在 以 互联 网 十 .Web 2. 0 推动 社会 发 展 的 新 时 期 ,日 益 丰 富 的 数据 类 型 和 高 并 发 、 秒 级 
响应 的 处 理 需求 ,对 数据 存储 及 数据 处 理 技术 提出 了 新 要 求 。 于 是 ,采用 不 同 的 对 象 建 模 方 
法 (面向 对 象 .XML 图、 列 、 键 值 .文本 ) 不 同 计算 机 技术 (分 布 式 、 并 行 )、 在 不 同 应 用 领域 
(工程 科学 、 空 间 、 时 间 ) ,数据 库 技术 都 绽放 出 新 的 生命 力 , 非 关系 型 数据 管理 和 分 析 技术 
在 诸多 领域 与 关系 型 数据 库 管 理 技术 展开 了 竞争 ,并 在 竞争 中 相互 借鉴 发展 和 融合 ,形成 
了 新 格局 下 的 数据 库 新 时 代 。 
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